Extracción automática de colocacións e modismos

Nas definicións estatísticas das colocacións estas son descritas como combinacións de palabras que coaparecen con máis frecuencia do que se prediciría a partir das súas frecuencias respectivas e a lonxitude do texto. Dende que Sinclair (1970) propuxo este suposto nos seus traballos leváronse a ca...

Full description

Bibliographic Details
Main Authors: Antonio Pamies Bertrán, José Manuel Pazos Bretaña
Format: Article
Language:English
Published: Centro Ramón Piñeiro para a Investigación en Humanidades (Xunta de Galicia) 2004-12-01
Series:Cadernos de Fraseoloxía Galega
Subjects:
Online Access:https://www.cirp.gal/pub/docs/cfg/cfg06_11.pdf
_version_ 1818407068078440448
author Antonio Pamies Bertrán
José Manuel Pazos Bretaña
author_facet Antonio Pamies Bertrán
José Manuel Pazos Bretaña
author_sort Antonio Pamies Bertrán
collection DOAJ
description Nas definicións estatísticas das colocacións estas son descritas como combinacións de palabras que coaparecen con máis frecuencia do que se prediciría a partir das súas frecuencias respectivas e a lonxitude do texto. Dende que Sinclair (1970) propuxo este suposto nos seus traballos leváronse a cabo, con diferentes criterios e métodos, múltiples estudos experimentais con córpora electrónicos dos que se obtiveron resultados diversos (p.ex. Berry-Roghe 1973; Church e Hanks 1989; Clear 1993; Dunning 1993). No noso traballo aplícanse métodos diferentes a un pequeno corpus literario da lingua española co fin de avaliar, co mesmo texto e os mesmos criterios, cada unha das ferramentas metodolóxicas que poderían ser empregadas na detección automática de colocacións en base a datos estritamente cuantitativos, as cales poderían tamén manexar locucións e mesmo refráns. // Statistical definitions of collocations describe them as combinations of words which co-occur more often than their respective frequencies and the length of the text would predict. Since Sinclair’s works (1970) proposed this assumption, many experimental works, with different methods and criteria, have been carried out with electronic corpora obtaining different results (e.g. Berry-Roghe 1973; Church & Hanks 1989; Clear 1993; Dunning 1993). Our work applies different methods to a small literary corpus in Spanish language, in order to evaluate, with the same text and the same criteria, each methodological tool that could be involved in automatic detection of collocations on the basis of strictly quantitative data, which should deal also with idioms and even proverbs.
first_indexed 2024-12-14T09:21:57Z
format Article
id doaj.art-173f8f125c8a4786b4a4e7ba6b55cb45
institution Directory Open Access Journal
issn 2605-4507
language English
last_indexed 2024-12-14T09:21:57Z
publishDate 2004-12-01
publisher Centro Ramón Piñeiro para a Investigación en Humanidades (Xunta de Galicia)
record_format Article
series Cadernos de Fraseoloxía Galega
spelling doaj.art-173f8f125c8a4786b4a4e7ba6b55cb452022-12-21T23:08:18ZengCentro Ramón Piñeiro para a Investigación en Humanidades (Xunta de Galicia)Cadernos de Fraseoloxía Galega2605-45072004-12-016191203Extracción automática de colocacións e modismosAntonio Pamies Bertrán0José Manuel Pazos Bretaña1Universidad de GranadaUniversidad de GranadaNas definicións estatísticas das colocacións estas son descritas como combinacións de palabras que coaparecen con máis frecuencia do que se prediciría a partir das súas frecuencias respectivas e a lonxitude do texto. Dende que Sinclair (1970) propuxo este suposto nos seus traballos leváronse a cabo, con diferentes criterios e métodos, múltiples estudos experimentais con córpora electrónicos dos que se obtiveron resultados diversos (p.ex. Berry-Roghe 1973; Church e Hanks 1989; Clear 1993; Dunning 1993). No noso traballo aplícanse métodos diferentes a un pequeno corpus literario da lingua española co fin de avaliar, co mesmo texto e os mesmos criterios, cada unha das ferramentas metodolóxicas que poderían ser empregadas na detección automática de colocacións en base a datos estritamente cuantitativos, as cales poderían tamén manexar locucións e mesmo refráns. // Statistical definitions of collocations describe them as combinations of words which co-occur more often than their respective frequencies and the length of the text would predict. Since Sinclair’s works (1970) proposed this assumption, many experimental works, with different methods and criteria, have been carried out with electronic corpora obtaining different results (e.g. Berry-Roghe 1973; Church & Hanks 1989; Clear 1993; Dunning 1993). Our work applies different methods to a small literary corpus in Spanish language, in order to evaluate, with the same text and the same criteria, each methodological tool that could be involved in automatic detection of collocations on the basis of strictly quantitative data, which should deal also with idioms and even proverbs.https://www.cirp.gal/pub/docs/cfg/cfg06_11.pdfextracción automáticaautomatic extractioncolocaciónscollocationsmodismosidiomsfraseoloxíaphraseology
spellingShingle Antonio Pamies Bertrán
José Manuel Pazos Bretaña
Extracción automática de colocacións e modismos
Cadernos de Fraseoloxía Galega
extracción automática
automatic extraction
colocacións
collocations
modismos
idioms
fraseoloxía
phraseology
title Extracción automática de colocacións e modismos
title_full Extracción automática de colocacións e modismos
title_fullStr Extracción automática de colocacións e modismos
title_full_unstemmed Extracción automática de colocacións e modismos
title_short Extracción automática de colocacións e modismos
title_sort extraccion automatica de colocacions e modismos
topic extracción automática
automatic extraction
colocacións
collocations
modismos
idioms
fraseoloxía
phraseology
url https://www.cirp.gal/pub/docs/cfg/cfg06_11.pdf
work_keys_str_mv AT antoniopamiesbertran extraccionautomaticadecolocacionsemodismos
AT josemanuelpazosbretana extraccionautomaticadecolocacionsemodismos