Discriminación de Sentidos Basada en Análisis Estadístico de Textos

Durante a.os han existido programas que de manera autom.tica obtienen informaci.n acerca de entidades como personas, organizaciones o conceptos científicos a partir de repositorios de texto en formato digital tales como la Web u otras fuentes. Sin embargo, todav.a existe una serie de dificultades q...

Full description

Bibliographic Details
Main Author: Rogelio Nazar
Format: Article
Language:Catalan
Published: Hipatia Press 2013-06-01
Series:BRAC
Subjects:
Online Access:https://hipatiapress.com/hpjournals/index.php/brac/article/view/608
Description
Summary:Durante a.os han existido programas que de manera autom.tica obtienen informaci.n acerca de entidades como personas, organizaciones o conceptos científicos a partir de repositorios de texto en formato digital tales como la Web u otras fuentes. Sin embargo, todav.a existe una serie de dificultades que no se han podido resolver, por ejemplo cuando distintas entidades son designadas con un mismo nombre (como el rat.n, que puede ser un dispositivo periférico en computación o bien un mam.fero). El presente artículo propone un método para resolver este problema basado en el análisis de la frecuencia de las palabras que se encuentran en el contexto de aparición de la palabra ambigua. Cada uno de los sentidos de una palabra polisémica se representan mediante los correspondientes grupos de otras unidades léxicas que muestran tendencia a aparecer en el contexto de esta palabra. El interés de esta propuesta reside en que no requiere ning.n tipo de conocimiento externo al corpus, como conocimiento del mundo o de la lengua de los textos.
ISSN:2014-8992