Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева
Переключение кода — это явление, при котором в одном и том же сообщении используются два или более языка. В настоящее время в социальных сетях, дискурсе IT-специалистов и билингвов довольно часто можно встретить сообщения на смешанных языках. Этот языковой феномен представляет собой проблему для ря...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Herzen State Pedagogical University of Russia
2023-04-01
|
Series: | Комплексные исследования детства |
Subjects: | |
Online Access: | https://www.kid-journal.ru/index.php/main/article/view/217 |
_version_ | 1797786070705766400 |
---|---|
author | Ольга Денисовна Рябова |
author_facet | Ольга Денисовна Рябова |
author_sort | Ольга Денисовна Рябова |
collection | DOAJ |
description |
Переключение кода — это явление, при котором в одном и том же сообщении используются два или более языка. В настоящее время в социальных сетях, дискурсе IT-специалистов и билингвов довольно часто можно встретить сообщения на смешанных языках. Этот языковой феномен представляет собой проблему для ряда задач обработки естественного языка, включая анализ настроений.
В данной статье изучается согласованность разметки тональности текстов с переключением на латиницу экспертами с помощью инструментов, которые показали высокую эффективность в междисциплинарных исследованиях. К числу таких методов относится 2B-PLS, обеспечивающий дополнительные возможности для анализа современных экспериментов в нейролингвистике, психофизиологии и других областях наук.
Для примера был выбран роман Сергея Минаева «The Телки. Повесть о ненастоящей любви», который был издан в 2008 году. Были выбраны 100 предложений, как из речи автора, так и из диалогов персонажей, содержащие в себе слова, написанные на латинице. Из предложений был собран и размечен датасет в формате CSV для дальнейшего построения модели.
Параметрами для 2B-PLS анализа послужили результаты экспертной оценки тональности выбранных предложений: количество сущностей на латинице и всего во фразе соответственно, согласованность в оценках экспертов позитивной, негативной и нейтральной тональностей, признаки категорий сущностей на латинице Локация, Персона, Время/Дата, Бренд, Организация, Модель, незначащая сущность соответственно.
2B-PLS анализ показал возможность анализа согласованности оценок тональность фразы экспертами в зависимости от знаний, извлеченных из предложений: именованных сущностей и другой статистики. На согласованность оценок экспертов влияет не только сама категория сущностей, но и тональность фразы, а также общее количество сущностей и сущностей на латинице во фразе.
Полученные результаты соотносятся с теоретическими исследованиями.
|
first_indexed | 2024-03-13T01:02:52Z |
format | Article |
id | doaj.art-40616437fbf14d8688f3a9bea1aca976 |
institution | Directory Open Access Journal |
issn | 2687-0223 |
language | English |
last_indexed | 2024-03-13T01:02:52Z |
publishDate | 2023-04-01 |
publisher | Herzen State Pedagogical University of Russia |
record_format | Article |
series | Комплексные исследования детства |
spelling | doaj.art-40616437fbf14d8688f3a9bea1aca9762023-07-06T09:47:30ZengHerzen State Pedagogical University of RussiaКомплексные исследования детства2687-02232023-04-015110.33910/2687-0223-2023-5-1-37-45Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея МинаеваОльга Денисовна Рябова0Новосибирский национальный исследовательский государственный университет Переключение кода — это явление, при котором в одном и том же сообщении используются два или более языка. В настоящее время в социальных сетях, дискурсе IT-специалистов и билингвов довольно часто можно встретить сообщения на смешанных языках. Этот языковой феномен представляет собой проблему для ряда задач обработки естественного языка, включая анализ настроений. В данной статье изучается согласованность разметки тональности текстов с переключением на латиницу экспертами с помощью инструментов, которые показали высокую эффективность в междисциплинарных исследованиях. К числу таких методов относится 2B-PLS, обеспечивающий дополнительные возможности для анализа современных экспериментов в нейролингвистике, психофизиологии и других областях наук. Для примера был выбран роман Сергея Минаева «The Телки. Повесть о ненастоящей любви», который был издан в 2008 году. Были выбраны 100 предложений, как из речи автора, так и из диалогов персонажей, содержащие в себе слова, написанные на латинице. Из предложений был собран и размечен датасет в формате CSV для дальнейшего построения модели. Параметрами для 2B-PLS анализа послужили результаты экспертной оценки тональности выбранных предложений: количество сущностей на латинице и всего во фразе соответственно, согласованность в оценках экспертов позитивной, негативной и нейтральной тональностей, признаки категорий сущностей на латинице Локация, Персона, Время/Дата, Бренд, Организация, Модель, незначащая сущность соответственно. 2B-PLS анализ показал возможность анализа согласованности оценок тональность фразы экспертами в зависимости от знаний, извлеченных из предложений: именованных сущностей и другой статистики. На согласованность оценок экспертов влияет не только сама категория сущностей, но и тональность фразы, а также общее количество сущностей и сущностей на латинице во фразе. Полученные результаты соотносятся с теоретическими исследованиями. https://www.kid-journal.ru/index.php/main/article/view/2172B-PLSпереключение кодаименованные сущностианализ тональностиСергей Минаевизвлечение информации из текстов |
spellingShingle | Ольга Денисовна Рябова Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева Комплексные исследования детства 2B-PLS переключение кода именованные сущности анализ тональности Сергей Минаев извлечение информации из текстов |
title | Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева |
title_full | Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева |
title_fullStr | Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева |
title_full_unstemmed | Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева |
title_short | Применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа Сергея Минаева |
title_sort | применение психофизиологического инструментария для оценки согласованности в разметке тональности текстов с переключением кода на основе романа сергея минаева |
topic | 2B-PLS переключение кода именованные сущности анализ тональности Сергей Минаев извлечение информации из текстов |
url | https://www.kid-journal.ru/index.php/main/article/view/217 |
work_keys_str_mv | AT olʹgadenisovnarâbova primeneniepsihofiziologičeskogoinstrumentariâdlâocenkisoglasovannostivrazmetketonalʹnostitekstovspereklûčeniemkodanaosnoveromanasergeâminaeva |