Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales

Notre objectif, dans le cadre de cet article, est d’étudier les résultats produits par un système d’analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles – synonymie, antonymie, hy...

Full description

Bibliographic Details
Main Authors: Fabre Cécile, Morlane-Hondère François
Format: Article
Language:English
Published: EDP Sciences 2012-07-01
Series:SHS Web of Conferences
Online Access:http://dx.doi.org/10.1051/shsconf/20120100293
_version_ 1818878161833689088
author Fabre Cécile
Morlane-Hondère François
author_facet Fabre Cécile
Morlane-Hondère François
author_sort Fabre Cécile
collection DOAJ
description Notre objectif, dans le cadre de cet article, est d’étudier les résultats produits par un système d’analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles – synonymie, antonymie, hyperonymie, méronymie. Le test de substituabilité est le critère clé auquel les lexicologues ont recours pour identifier la plupart des relations de nature paradigmatique entre mots (Cruse 1986 ; Murphy 2003). Un système d'analyse distributionnelle automatique offre précisément la possibilité de mettre en œuvre ce test à grande échelle, sur un large corpus. Il constitue un outil intéressant pour la vérification empirique de ce principe et, de façon plus générale, pour l’étude de ces relations sémantiques en corpus. Nous avons choisi d'aborder cette question en confrontant les résultats du programme d’AD dont nous disposons avec des données issues de ressources lexicales recensant différents types de relations sémantiques (synonymie, antonymie, hyperonymie, méronymie). Cette confrontation montre de forts décalages entre la ressource distributionnelle et ces lexiques. Si une part importante des paires reliées dans les lexiques sont des voisins distributionnels, c'est loin d'être toujours le cas, même quand il s'agit d'unités lexicales fréquentes dans le corpus. Nous essayons de comprendre les raisons de ces décalages en nous appuyant sur les informations que nous fournit l’analyse automatique. Cette étude est menée sur des données en français.
first_indexed 2024-12-19T14:09:47Z
format Article
id doaj.art-3a47ee0fb7814273aca8bbab47980828
institution Directory Open Access Journal
issn 2261-2424
language English
last_indexed 2024-12-19T14:09:47Z
publishDate 2012-07-01
publisher EDP Sciences
record_format Article
series SHS Web of Conferences
spelling doaj.art-3a47ee0fb7814273aca8bbab479808282022-12-21T20:18:10ZengEDP SciencesSHS Web of Conferences2261-24242012-07-0111001101510.1051/shsconf/20120100293Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicalesFabre CécileMorlane-Hondère FrançoisNotre objectif, dans le cadre de cet article, est d’étudier les résultats produits par un système d’analyse distributionnelle automatique afin de mieux comprendre sous quelles conditions le critère distributionnel permet de repérer les relations lexicales les plus usuelles – synonymie, antonymie, hyperonymie, méronymie. Le test de substituabilité est le critère clé auquel les lexicologues ont recours pour identifier la plupart des relations de nature paradigmatique entre mots (Cruse 1986 ; Murphy 2003). Un système d'analyse distributionnelle automatique offre précisément la possibilité de mettre en œuvre ce test à grande échelle, sur un large corpus. Il constitue un outil intéressant pour la vérification empirique de ce principe et, de façon plus générale, pour l’étude de ces relations sémantiques en corpus. Nous avons choisi d'aborder cette question en confrontant les résultats du programme d’AD dont nous disposons avec des données issues de ressources lexicales recensant différents types de relations sémantiques (synonymie, antonymie, hyperonymie, méronymie). Cette confrontation montre de forts décalages entre la ressource distributionnelle et ces lexiques. Si une part importante des paires reliées dans les lexiques sont des voisins distributionnels, c'est loin d'être toujours le cas, même quand il s'agit d'unités lexicales fréquentes dans le corpus. Nous essayons de comprendre les raisons de ces décalages en nous appuyant sur les informations que nous fournit l’analyse automatique. Cette étude est menée sur des données en français.http://dx.doi.org/10.1051/shsconf/20120100293
spellingShingle Fabre Cécile
Morlane-Hondère François
Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
SHS Web of Conferences
title Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
title_full Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
title_fullStr Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
title_full_unstemmed Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
title_short Le test de substituabilité à l'épreuve des corpus : utiliser l'analyse distributionnelle automatique pour l'étude des relations lexicales
title_sort le test de substituabilite a l epreuve des corpus utiliser l analyse distributionnelle automatique pour l etude des relations lexicales
url http://dx.doi.org/10.1051/shsconf/20120100293
work_keys_str_mv AT fabrececile letestdesubstituabilitealepreuvedescorpusutiliserlanalysedistributionnelleautomatiquepourletudedesrelationslexicales
AT morlanehonderefrancois letestdesubstituabilitealepreuvedescorpusutiliserlanalysedistributionnelleautomatiquepourletudedesrelationslexicales