Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
Notre objectif, dans le cadre de cet article, est d’étudier les résultats produits par un système d’analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles – synonymie, antonymie, hy...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
EDP Sciences
2012-07-01
|
Series: | SHS Web of Conferences |
Online Access: | http://dx.doi.org/10.1051/shsconf/20120100293 |
_version_ | 1818878161833689088 |
---|---|
author | Fabre Cécile Morlane-Hondère François |
author_facet | Fabre Cécile Morlane-Hondère François |
author_sort | Fabre Cécile |
collection | DOAJ |
description | Notre objectif, dans le cadre de cet article, est d’étudier les résultats produits par un système d’analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles – synonymie, antonymie, hyperonymie, méronymie. Le test de substituabilité est le critère clé auquel les lexicologues ont recours pour identifier la plupart des relations de nature paradigmatique entre mots (Cruse 1986 ; Murphy 2003). Un système d'analyse distributionnelle automatique offre précisément la possibilité de mettre en œuvre ce test à grande échelle, sur un large corpus. Il constitue un outil intéressant pour la vérification empirique de ce principe et, de façon plus générale, pour l’étude de ces relations sémantiques en corpus. Nous avons choisi d'aborder cette question en confrontant les résultats du programme d’AD dont nous disposons avec des données issues de ressources lexicales recensant différents types de relations sémantiques (synonymie, antonymie, hyperonymie, méronymie). Cette confrontation montre de forts décalages entre la ressource distributionnelle et ces lexiques. Si une part importante des paires reliées dans les lexiques sont des voisins distributionnels, c'est loin d'être toujours le cas, même quand il s'agit d'unités lexicales fréquentes dans le corpus. Nous essayons de comprendre les raisons de ces décalages en nous appuyant sur les informations que nous fournit l’analyse automatique. Cette étude est menée sur des données en français. |
first_indexed | 2024-12-19T14:09:47Z |
format | Article |
id | doaj.art-3a47ee0fb7814273aca8bbab47980828 |
institution | Directory Open Access Journal |
issn | 2261-2424 |
language | English |
last_indexed | 2024-12-19T14:09:47Z |
publishDate | 2012-07-01 |
publisher | EDP Sciences |
record_format | Article |
series | SHS Web of Conferences |
spelling | doaj.art-3a47ee0fb7814273aca8bbab479808282022-12-21T20:18:10ZengEDP SciencesSHS Web of Conferences2261-24242012-07-0111001101510.1051/shsconf/20120100293Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicalesFabre CécileMorlane-Hondère FrançoisNotre objectif, dans le cadre de cet article, est d’étudier les résultats produits par un système d’analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles – synonymie, antonymie, hyperonymie, méronymie. Le test de substituabilité est le critère clé auquel les lexicologues ont recours pour identifier la plupart des relations de nature paradigmatique entre mots (Cruse 1986 ; Murphy 2003). Un système d'analyse distributionnelle automatique offre précisément la possibilité de mettre en œuvre ce test à grande échelle, sur un large corpus. Il constitue un outil intéressant pour la vérification empirique de ce principe et, de façon plus générale, pour l’étude de ces relations sémantiques en corpus. Nous avons choisi d'aborder cette question en confrontant les résultats du programme d’AD dont nous disposons avec des données issues de ressources lexicales recensant différents types de relations sémantiques (synonymie, antonymie, hyperonymie, méronymie). Cette confrontation montre de forts décalages entre la ressource distributionnelle et ces lexiques. Si une part importante des paires reliées dans les lexiques sont des voisins distributionnels, c'est loin d'être toujours le cas, même quand il s'agit d'unités lexicales fréquentes dans le corpus. Nous essayons de comprendre les raisons de ces décalages en nous appuyant sur les informations que nous fournit l’analyse automatique. Cette étude est menée sur des données en français.http://dx.doi.org/10.1051/shsconf/20120100293 |
spellingShingle | Fabre Cécile Morlane-Hondère François Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales SHS Web of Conferences |
title | Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales |
title_full | Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales |
title_fullStr | Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales |
title_full_unstemmed | Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales |
title_short | Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales |
title_sort | le test de substituabilite a l epreuve des corpus utiliser l analyse distributionnelle automatique pour l etude des relations lexicales |
url | http://dx.doi.org/10.1051/shsconf/20120100293 |
work_keys_str_mv | AT fabrececile letestdesubstituabilitealepreuvedescorpusutiliserlanalysedistributionnelleautomatiquepourletudedesrelationslexicales AT morlanehonderefrancois letestdesubstituabilitealepreuvedescorpusutiliserlanalysedistributionnelleautomatiquepourletudedesrelationslexicales |