Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec
Цель исследования, первые результаты которого представлены в настоящей статье, — анализ состава и особенностей функционирования терминологической лексики в учебниках для средней школы Российской Федерации с помощью методов и средств компьютерной лингвистики. Количество терминов из разных областей зн...
Main Authors: | , , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Herzen State Pedagogical University of Russia
2021-09-01
|
Series: | Journal of Applied Linguistics and Lexicography |
Subjects: | |
Online Access: | https://journall.org/index.php/main/article/view/55 |
_version_ | 1818390776872173568 |
---|---|
author | Сергей Игоревич Монахов Владимир Владимирович Турчаненко Екатерина Алексеевна Федюкова Дмитрий Наилевич Чердаков |
author_facet | Сергей Игоревич Монахов Владимир Владимирович Турчаненко Екатерина Алексеевна Федюкова Дмитрий Наилевич Чердаков |
author_sort | Сергей Игоревич Монахов |
collection | DOAJ |
description | Цель исследования, первые результаты которого представлены в настоящей статье, — анализ состава и особенностей функционирования терминологической лексики в учебниках для средней школы Российской Федерации с помощью методов и средств компьютерной лингвистики. Количество терминов из разных областей знания, которое школьник должен усвоить за время обучения в средней школе, никогда не подвергалось оценке. По предварительным подсчетам, произведенным на материале Примерной основной образовательной программы общего и среднего образования 2015 года только в части предмета «Русский язык», ученик в 5–11 классах средней школы должен понимать, распознавать и уметь употреблять около 1000 терминов и терминологических сочетаний из этой сферы знания. Таким образом, учитывая количество школьных дисциплин, общее число единиц специальной лексики, изучаемых в общеобразовательной школе, измеряется тысячами. В то же время сопоставительные характеристики состава и функционирования терминов в учебниках для разных школьных предметов не изучены и остаются неизвестными. Неясна корреляция между терминологической плотностью учебного текста в школьных учебниках по разным предметам и местом, занимаемым этими предметами в учебных планах. Традиционным способом вычленения терминов из специальных текстов является их просмотр и «ручное» формирование соответствующих перечней. При надежности такого способа в отношении интеллектуализации принципов отбора он плохо приложим к большим массивам данных и не отражает ни частотность употребления терминов, ни специфику их синтагматических связей, ни системные отношения между терминами, формируемые их сочетаемостным поведением. Реализация описываемого проекта предусматривает создание полнотекстового корпуса на материале текстов школьных учебников 5–11 классов, включенных в Федеральный перечень Министерства просвещения РФ, автоматическое вычленение и стратификацию терминов при помощи методов дистрибутивной семантики, создание и обучение глубокой нейросети, способной по поданной на вход группе векторных представлений терминов определить учебную дисциплину, уровень обучения и учебную тему. Результаты исследования могут представлять теоретический интерес в перспективе развития терминоведения и иметь практическое применение при создании школьной учебной литературы разных типов. |
first_indexed | 2024-12-14T05:03:01Z |
format | Article |
id | doaj.art-1cc6e90f66014a0ebff23b0c6b4b1333 |
institution | Directory Open Access Journal |
issn | 2687-0215 |
language | English |
last_indexed | 2024-12-14T05:03:01Z |
publishDate | 2021-09-01 |
publisher | Herzen State Pedagogical University of Russia |
record_format | Article |
series | Journal of Applied Linguistics and Lexicography |
spelling | doaj.art-1cc6e90f66014a0ebff23b0c6b4b13332022-12-21T23:16:11ZengHerzen State Pedagogical University of RussiaJournal of Applied Linguistics and Lexicography2687-02152021-09-012210.33910/2687-0215-2020-2-2-118-146Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2VecСергей Игоревич Монахов0Владимир Владимирович Турчаненко1Екатерина Алексеевна Федюкова2Дмитрий Наилевич Чердаков3Российский государственный педагогический университет им. А. И. ГерценаРоссийский государственный педагогический университет им. А. И. Герцена; Институт русской литературы (Пушкинский дом) РАННезависимый исследовательРоссийский государственный педагогический университет им. А. И. Герцена; Санкт-Петербургский государственный университетЦель исследования, первые результаты которого представлены в настоящей статье, — анализ состава и особенностей функционирования терминологической лексики в учебниках для средней школы Российской Федерации с помощью методов и средств компьютерной лингвистики. Количество терминов из разных областей знания, которое школьник должен усвоить за время обучения в средней школе, никогда не подвергалось оценке. По предварительным подсчетам, произведенным на материале Примерной основной образовательной программы общего и среднего образования 2015 года только в части предмета «Русский язык», ученик в 5–11 классах средней школы должен понимать, распознавать и уметь употреблять около 1000 терминов и терминологических сочетаний из этой сферы знания. Таким образом, учитывая количество школьных дисциплин, общее число единиц специальной лексики, изучаемых в общеобразовательной школе, измеряется тысячами. В то же время сопоставительные характеристики состава и функционирования терминов в учебниках для разных школьных предметов не изучены и остаются неизвестными. Неясна корреляция между терминологической плотностью учебного текста в школьных учебниках по разным предметам и местом, занимаемым этими предметами в учебных планах. Традиционным способом вычленения терминов из специальных текстов является их просмотр и «ручное» формирование соответствующих перечней. При надежности такого способа в отношении интеллектуализации принципов отбора он плохо приложим к большим массивам данных и не отражает ни частотность употребления терминов, ни специфику их синтагматических связей, ни системные отношения между терминами, формируемые их сочетаемостным поведением. Реализация описываемого проекта предусматривает создание полнотекстового корпуса на материале текстов школьных учебников 5–11 классов, включенных в Федеральный перечень Министерства просвещения РФ, автоматическое вычленение и стратификацию терминов при помощи методов дистрибутивной семантики, создание и обучение глубокой нейросети, способной по поданной на вход группе векторных представлений терминов определить учебную дисциплину, уровень обучения и учебную тему. Результаты исследования могут представлять теоретический интерес в перспективе развития терминоведения и иметь практическое применение при создании школьной учебной литературы разных типов.https://journall.org/index.php/main/article/view/55терминтерминологиявекторное представлениеучебникобщее образованиерусский язык |
spellingShingle | Сергей Игоревич Монахов Владимир Владимирович Турчаненко Екатерина Алексеевна Федюкова Дмитрий Наилевич Чердаков Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec Journal of Applied Linguistics and Lexicography термин терминология векторное представление учебник общее образование русский язык |
title | Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec |
title_full | Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec |
title_fullStr | Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec |
title_full_unstemmed | Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec |
title_short | Изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков Word2Vec |
title_sort | изучение терминологических подсистем современных школьных учебников на русском языке с помощью модели анализа семантики естественных языков word2vec |
topic | термин терминология векторное представление учебник общее образование русский язык |
url | https://journall.org/index.php/main/article/view/55 |
work_keys_str_mv | AT sergejigorevičmonahov izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec AT vladimirvladimirovičturčanenko izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec AT ekaterinaalekseevnafedûkova izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec AT dmitrijnaileviččerdakov izučenieterminologičeskihpodsistemsovremennyhškolʹnyhučebnikovnarusskomâzykespomoŝʹûmodelianalizasemantikiestestvennyhâzykovword2vec |