Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec

Цель исследования, первые результаты которого представлены в настоящей статье, — анализ состава и особенностей функционирования терминологической лексики в учебниках для средней школы Российской Федерации с помощью методов и средств компьютерной лингвистики. Количество терминов из разных областей зн...

Full description

Bibliographic Details
Main Authors: Сергей Игоревич Монахов, Владимир Владимирович Турчаненко, Екатерина Алексеевна Федюкова, Дмитрий Наилевич Чердаков
Format: Article
Language:English
Published: Herzen State Pedagogical University of Russia 2021-09-01
Series:Journal of Applied Linguistics and Lexicography
Subjects:
Online Access:https://journall.org/index.php/main/article/view/55
_version_ 1818390776872173568
author Сергей Игоревич Монахов
Владимир Владимирович Турчаненко
Екатерина Алексеевна Федюкова
Дмитрий Наилевич Чердаков
author_facet Сергей Игоревич Монахов
Владимир Владимирович Турчаненко
Екатерина Алексеевна Федюкова
Дмитрий Наилевич Чердаков
author_sort Сергей Игоревич Монахов
collection DOAJ
description Цель исследования, первые результаты которого представлены в настоящей статье, — анализ состава и особенностей функционирования терминологической лексики в учебниках для средней школы Российской Федерации с помощью методов и средств компьютерной лингвистики. Количество терминов из разных областей знания, которое школьник должен усвоить за время обучения в средней школе, никогда не подвергалось оценке. По предварительным подсчетам, произведенным на материале Примерной основной образовательной программы общего и среднего образования 2015 года только в части предмета «Русский язык», ученик в 5–11 классах средней школы должен понимать, распознавать и уметь употреблять около 1000 терминов и терминологических сочетаний из этой сферы знания. Таким образом, учитывая количество школьных дисциплин, общее число единиц специальной лексики, изучаемых в общеобразовательной школе, измеряется тысячами. В то же время сопоставительные характеристики состава и функционирования терминов в учебниках для разных школьных предметов не изучены и остаются неизвестными. Неясна корреляция между терминологической плотностью учебного текста в школьных учебниках по разным предметам и местом, занимаемым этими предметами в учебных планах. Традиционным способом вычленения терминов из специальных текстов является их просмотр и «ручное» формирование соответствующих перечней. При надежности такого способа в отношении интеллектуализации принципов отбора он плохо приложим к большим массивам данных и не отражает ни частотность употребления терминов, ни специфику их синтагматических связей, ни системные отношения между терминами, формируемые их сочетаемостным поведением. Реализация описываемого проекта предусматривает создание полнотекстового корпуса на материале текстов школьных учебников 5–11 классов, включенных в Федеральный перечень Министерства просвещения РФ, автоматическое вычленение и стратификацию терминов при помощи методов дистрибутивной семантики, создание и обучение глубокой нейросети, способной по поданной на вход группе векторных представлений терминов определить учебную дисциплину, уровень обучения и учебную тему. Результаты исследования могут представлять теоретический интерес в перспективе развития терминоведения и иметь практическое применение при создании школьной учебной литературы разных типов.
first_indexed 2024-12-14T05:03:01Z
format Article
id doaj.art-1cc6e90f66014a0ebff23b0c6b4b1333
institution Directory Open Access Journal
issn 2687-0215
language English
last_indexed 2024-12-14T05:03:01Z
publishDate 2021-09-01
publisher Herzen State Pedagogical University of Russia
record_format Article
series Journal of Applied Linguistics and Lexicography
spelling doaj.art-1cc6e90f66014a0ebff23b0c6b4b13332022-12-21T23:16:11ZengHerzen State Pedagogical University of RussiaJournal of Applied Linguistics and Lexicography2687-02152021-09-012210.33910/2687-0215-2020-2-2-118-146Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2VecСергей Игоревич Монахов0Владимир Владимирович Турчаненко1Екатерина Алексеевна Федюкова2Дмитрий Наилевич Чердаков3Российский государственный педагогический университет им. А. И. ГерценаРоссийский государственный педагогический университет им. А. И. Герцена; Институт русской литературы (Пушкинский дом) РАННезависимый исследовательРоссийский государственный педагогический университет им. А. И. Герцена; Санкт-Петербургский государственный университетЦель исследования, первые результаты которого представлены в настоящей статье, — анализ состава и особенностей функционирования терминологической лексики в учебниках для средней школы Российской Федерации с помощью методов и средств компьютерной лингвистики. Количество терминов из разных областей знания, которое школьник должен усвоить за время обучения в средней школе, никогда не подвергалось оценке. По предварительным подсчетам, произведенным на материале Примерной основной образовательной программы общего и среднего образования 2015 года только в части предмета «Русский язык», ученик в 5–11 классах средней школы должен понимать, распознавать и уметь употреблять около 1000 терминов и терминологических сочетаний из этой сферы знания. Таким образом, учитывая количество школьных дисциплин, общее число единиц специальной лексики, изучаемых в общеобразовательной школе, измеряется тысячами. В то же время сопоставительные характеристики состава и функционирования терминов в учебниках для разных школьных предметов не изучены и остаются неизвестными. Неясна корреляция между терминологической плотностью учебного текста в школьных учебниках по разным предметам и местом, занимаемым этими предметами в учебных планах. Традиционным способом вычленения терминов из специальных текстов является их просмотр и «ручное» формирование соответствующих перечней. При надежности такого способа в отношении интеллектуализации принципов отбора он плохо приложим к большим массивам данных и не отражает ни частотность употребления терминов, ни специфику их синтагматических связей, ни системные отношения между терминами, формируемые их сочетаемостным поведением. Реализация описываемого проекта предусматривает создание полнотекстового корпуса на материале текстов школьных учебников 5–11 классов, включенных в Федеральный перечень Министерства просвещения РФ, автоматическое вычленение и стратификацию терминов при помощи методов дистрибутивной семантики, создание и обучение глубокой нейросети, способной по поданной на вход группе векторных представлений терминов определить учебную дисциплину, уровень обучения и учебную тему. Результаты исследования могут представлять теоретический интерес в перспективе развития терминоведения и иметь практическое применение при создании школьной учебной литературы разных типов.https://journall.org/index.php/main/article/view/55терминтерминологиявекторное представлениеучебникобщее образованиерусский язык
spellingShingle Сергей Игоревич Монахов
Владимир Владимирович Турчаненко
Екатерина Алексеевна Федюкова
Дмитрий Наилевич Чердаков
Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
Journal of Applied Linguistics and Lexicography
термин
терминология
векторное представление
учебник
общее образование
русский язык
title Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
title_full Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
title_fullStr Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
title_full_unstemmed Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
title_short Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
title_sort изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков word2vec
topic термин
терминология
векторное представление
учебник
общее образование
русский язык
url https://journall.org/index.php/main/article/view/55
work_keys_str_mv AT sergejigorevičmonahov izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec
AT vladimirvladimirovičturčanenko izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec
AT ekaterinaalekseevnafedûkova izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec
AT dmitrijnaileviččerdakov izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec