Extracción automática de colocacións e modismos
Nas definicións estatísticas das colocacións estas son descritas como combinacións de palabras que coaparecen con máis frecuencia do que se prediciría a partir das súas frecuencias respectivas e a lonxitude do texto. Dende que Sinclair (1970) propuxo este suposto nos seus traballos leváronse a ca...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Centro Ramón Piñeiro para a Investigación en Humanidades (Xunta de Galicia)
2004-12-01
|
Series: | Cadernos de Fraseoloxía Galega |
Subjects: | |
Online Access: | https://www.cirp.gal/pub/docs/cfg/cfg06_11.pdf |
_version_ | 1818407068078440448 |
---|---|
author | Antonio Pamies Bertrán José Manuel Pazos Bretaña |
author_facet | Antonio Pamies Bertrán José Manuel Pazos Bretaña |
author_sort | Antonio Pamies Bertrán |
collection | DOAJ |
description | Nas definicións estatísticas das colocacións estas son descritas como
combinacións de palabras que coaparecen con máis frecuencia do que se
prediciría a partir das súas frecuencias respectivas e a lonxitude do texto. Dende
que Sinclair (1970) propuxo este suposto nos seus traballos leváronse a cabo,
con diferentes criterios e métodos, múltiples estudos experimentais con córpora
electrónicos dos que se obtiveron resultados diversos (p.ex. Berry-Roghe 1973;
Church e Hanks 1989; Clear 1993; Dunning 1993). No noso traballo aplícanse
métodos diferentes a un pequeno corpus literario da lingua española co fin de
avaliar, co mesmo texto e os mesmos criterios, cada unha das ferramentas
metodolóxicas que poderían ser empregadas na detección automática de
colocacións en base a datos estritamente cuantitativos, as cales poderían tamén
manexar locucións e mesmo refráns. // Statistical definitions of collocations describe them as combinations of words
which co-occur more often than their respective frequencies and the length of the
text would predict. Since Sinclair’s works (1970) proposed this assumption, many
experimental works, with different methods and criteria, have been carried out with
electronic corpora obtaining different results (e.g. Berry-Roghe 1973; Church &
Hanks 1989; Clear 1993; Dunning 1993). Our work applies different methods to a
small literary corpus in Spanish language, in order to evaluate, with the same text
and the same criteria, each methodological tool that could be involved in
automatic detection of collocations on the basis of strictly quantitative data, which
should deal also with idioms and even proverbs. |
first_indexed | 2024-12-14T09:21:57Z |
format | Article |
id | doaj.art-173f8f125c8a4786b4a4e7ba6b55cb45 |
institution | Directory Open Access Journal |
issn | 2605-4507 |
language | English |
last_indexed | 2024-12-14T09:21:57Z |
publishDate | 2004-12-01 |
publisher | Centro Ramón Piñeiro para a Investigación en Humanidades (Xunta de Galicia) |
record_format | Article |
series | Cadernos de Fraseoloxía Galega |
spelling | doaj.art-173f8f125c8a4786b4a4e7ba6b55cb452022-12-21T23:08:18ZengCentro Ramón Piñeiro para a Investigación en Humanidades (Xunta de Galicia)Cadernos de Fraseoloxía Galega2605-45072004-12-016191203Extracción automática de colocacións e modismosAntonio Pamies Bertrán0José Manuel Pazos Bretaña1Universidad de GranadaUniversidad de GranadaNas definicións estatísticas das colocacións estas son descritas como combinacións de palabras que coaparecen con máis frecuencia do que se prediciría a partir das súas frecuencias respectivas e a lonxitude do texto. Dende que Sinclair (1970) propuxo este suposto nos seus traballos leváronse a cabo, con diferentes criterios e métodos, múltiples estudos experimentais con córpora electrónicos dos que se obtiveron resultados diversos (p.ex. Berry-Roghe 1973; Church e Hanks 1989; Clear 1993; Dunning 1993). No noso traballo aplícanse métodos diferentes a un pequeno corpus literario da lingua española co fin de avaliar, co mesmo texto e os mesmos criterios, cada unha das ferramentas metodolóxicas que poderían ser empregadas na detección automática de colocacións en base a datos estritamente cuantitativos, as cales poderían tamén manexar locucións e mesmo refráns. // Statistical definitions of collocations describe them as combinations of words which co-occur more often than their respective frequencies and the length of the text would predict. Since Sinclair’s works (1970) proposed this assumption, many experimental works, with different methods and criteria, have been carried out with electronic corpora obtaining different results (e.g. Berry-Roghe 1973; Church & Hanks 1989; Clear 1993; Dunning 1993). Our work applies different methods to a small literary corpus in Spanish language, in order to evaluate, with the same text and the same criteria, each methodological tool that could be involved in automatic detection of collocations on the basis of strictly quantitative data, which should deal also with idioms and even proverbs.https://www.cirp.gal/pub/docs/cfg/cfg06_11.pdfextracción automáticaautomatic extractioncolocaciónscollocationsmodismosidiomsfraseoloxíaphraseology |
spellingShingle | Antonio Pamies Bertrán José Manuel Pazos Bretaña Extracción automática de colocacións e modismos Cadernos de Fraseoloxía Galega extracción automática automatic extraction colocacións collocations modismos idioms fraseoloxía phraseology |
title | Extracción automática de colocacións e modismos |
title_full | Extracción automática de colocacións e modismos |
title_fullStr | Extracción automática de colocacións e modismos |
title_full_unstemmed | Extracción automática de colocacións e modismos |
title_short | Extracción automática de colocacións e modismos |
title_sort | extraccion automatica de colocacions e modismos |
topic | extracción automática automatic extraction colocacións collocations modismos idioms fraseoloxía phraseology |
url | https://www.cirp.gal/pub/docs/cfg/cfg06_11.pdf |
work_keys_str_mv | AT antoniopamiesbertran extraccionautomaticadecolocacionsemodismos AT josemanuelpazosbretana extraccionautomaticadecolocacionsemodismos |