O problemach z koreferencją
DOI: http://doi.org/10.26333/sts.xxviii.17 Celem niniejszego artykułu jest omówienie niektórych problemów, które występują podczas określania koreferencji w tekście. Analizy takie były prowadzone na potrzeby projektu CORE – Komputerowe metody identyfikacji nawiązań w tekstach polskich (kierowaneg...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Polskie Towarzystwo Semiotyczne / The Polish Semiotic Society
2020-01-01
|
Series: | Studia Semiotyczne |
Subjects: | |
Online Access: | http://studiasemiotyczne.pts.edu.pl/index.php/Studiasemiotyczne/article/view/97 |
_version_ | 1828950794793123840 |
---|---|
author | Magdalena Zawisławska |
author_facet | Magdalena Zawisławska |
author_sort | Magdalena Zawisławska |
collection | DOAJ |
description | DOI: http://doi.org/10.26333/sts.xxviii.17
Celem niniejszego artykułu jest omówienie niektórych problemów, które występują podczas określania koreferencji w tekście. Analizy takie były prowadzone na potrzeby projektu CORE – Komputerowe metody identyfikacji nawiązań w tekstach polskich (kierowanego przez Macieja Ogrodniczuka). Głównym celem projektu było stworzenie nowatorskich metod i narzędzi informatycznych służących do automatycznego wykrywania anafor i koreferencji w tekstach pisanych w języku polskim.
Główny problem z wyznaczaniem faz koreferencji w języku polskim wyłonił się w efekcie kilku czynników. Na poziomie pragmatycznym i semantycznym nie było proste zadecydować czy zachodziła identyczność, czy tylko podobieństwem między dwoma obiektami. Dodatkowym utrudnieniem był brak specjalistycznej wiedzy, który sprawił, że wyznaczenie faz koreferencji było szczególnie trudne między frazami w wyjątkowo specjalistycznych tekstach. Na poziomie gramatycznym, niektóre cechy języka polskiego utrudniły anotację. Ze względu na brak rodzajników określonych i nieokreślonych bardzo trudno było określić, czy nadawca zawsze miał na myśli ten sam obiekt, czy różne obiekty należące do tej samej klasy. Wreszcie, długie zdania bez podmiotu spowodowały pewne problemy przy wyznaczaniu łańcuchów koreferencyjnych między analizowanymi frazami. |
first_indexed | 2024-12-14T06:28:42Z |
format | Article |
id | doaj.art-310e8ce32b5a46e7af56a8534f5ff33f |
institution | Directory Open Access Journal |
issn | 0137-6608 2544-073X |
language | English |
last_indexed | 2024-12-14T06:28:42Z |
publishDate | 2020-01-01 |
publisher | Polskie Towarzystwo Semiotyczne / The Polish Semiotic Society |
record_format | Article |
series | Studia Semiotyczne |
spelling | doaj.art-310e8ce32b5a46e7af56a8534f5ff33f2022-12-21T23:13:36ZengPolskie Towarzystwo Semiotyczne / The Polish Semiotic SocietyStudia Semiotyczne0137-66082544-073X2020-01-01281O problemach z koreferencjąMagdalena Zawisławska0Uniwersytet WarszawskiDOI: http://doi.org/10.26333/sts.xxviii.17 Celem niniejszego artykułu jest omówienie niektórych problemów, które występują podczas określania koreferencji w tekście. Analizy takie były prowadzone na potrzeby projektu CORE – Komputerowe metody identyfikacji nawiązań w tekstach polskich (kierowanego przez Macieja Ogrodniczuka). Głównym celem projektu było stworzenie nowatorskich metod i narzędzi informatycznych służących do automatycznego wykrywania anafor i koreferencji w tekstach pisanych w języku polskim. Główny problem z wyznaczaniem faz koreferencji w języku polskim wyłonił się w efekcie kilku czynników. Na poziomie pragmatycznym i semantycznym nie było proste zadecydować czy zachodziła identyczność, czy tylko podobieństwem między dwoma obiektami. Dodatkowym utrudnieniem był brak specjalistycznej wiedzy, który sprawił, że wyznaczenie faz koreferencji było szczególnie trudne między frazami w wyjątkowo specjalistycznych tekstach. Na poziomie gramatycznym, niektóre cechy języka polskiego utrudniły anotację. Ze względu na brak rodzajników określonych i nieokreślonych bardzo trudno było określić, czy nadawca zawsze miał na myśli ten sam obiekt, czy różne obiekty należące do tej samej klasy. Wreszcie, długie zdania bez podmiotu spowodowały pewne problemy przy wyznaczaniu łańcuchów koreferencyjnych między analizowanymi frazami.http://studiasemiotyczne.pts.edu.pl/index.php/Studiasemiotyczne/article/view/97referencjakoreferencjakorpusanotacja |
spellingShingle | Magdalena Zawisławska O problemach z koreferencją Studia Semiotyczne referencja koreferencja korpus anotacja |
title | O problemach z koreferencją |
title_full | O problemach z koreferencją |
title_fullStr | O problemach z koreferencją |
title_full_unstemmed | O problemach z koreferencją |
title_short | O problemach z koreferencją |
title_sort | o problemach z koreferencja |
topic | referencja koreferencja korpus anotacja |
url | http://studiasemiotyczne.pts.edu.pl/index.php/Studiasemiotyczne/article/view/97 |
work_keys_str_mv | AT magdalenazawisławska oproblemachzkoreferencja |