Création semi-automatique d’un corpus annoté pour l’analyse d’opinions

Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’eff...

Full description

Bibliographic Details
Main Author: Sadoun Driss
Format: Article
Language:English
Published: EDP Sciences 2016-01-01
Series:SHS Web of Conferences
Online Access:http://dx.doi.org/10.1051/shsconf/20162711008
_version_ 1818918920435793920
author Sadoun Driss
author_facet Sadoun Driss
author_sort Sadoun Driss
collection DOAJ
description Nous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.
first_indexed 2024-12-20T00:57:38Z
format Article
id doaj.art-6133015d401645469c12a54283e9e94e
institution Directory Open Access Journal
issn 2261-2424
language English
last_indexed 2024-12-20T00:57:38Z
publishDate 2016-01-01
publisher EDP Sciences
record_format Article
series SHS Web of Conferences
spelling doaj.art-6133015d401645469c12a54283e9e94e2022-12-21T19:59:04ZengEDP SciencesSHS Web of Conferences2261-24242016-01-01271100810.1051/shsconf/20162711008shsconf_cmlf2016_11008Création semi-automatique d’un corpus annoté pour l’analyse d’opinionsSadoun DrissNous décrivons une méthode semi-automatique pour la création d’un corpus annoté en français. Ce corpus vise à permettre l’apprentissage d’un système d’analyse d’opinions dans des textes portant sur l’évaluation d’établissements de recherche et d’enseignement supérieur. La création de ce corpus s’effectue de manière itérative. Au cours de ces itérations une ontologie, une terminologie ainsi qu’un ensemble de patrons syntaxico sémantiques sont créés automatiquement à partir d’annotations antérieures effectuées par des experts du domaine. Ces ressources permettent par la suite de guider l’annotation automatique de nouveaux corpus. Chaque corpus annoté automatiquement est alors soumis à une nouvelle annotation manuelle des experts. Des résultats empiriques montrent que notre méthode permet d’accélérer et de faciliter le processus d’annotation. Le corpus résultat est annoté à la fois sémantiquement et syntaxiquement. Il est disponible gratuitement.http://dx.doi.org/10.1051/shsconf/20162711008
spellingShingle Sadoun Driss
Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
SHS Web of Conferences
title Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_full Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_fullStr Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_full_unstemmed Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_short Création semi-automatique d’un corpus annoté pour l’analyse d’opinions
title_sort creation semi automatique d un corpus annote pour l analyse d opinions
url http://dx.doi.org/10.1051/shsconf/20162711008
work_keys_str_mv AT sadoundriss creationsemiautomatiqueduncorpusannotepourlanalysedopinions