МЕТОД СИСТЕМНОЇ ІНЖЕНЕРІЇ СИСТЕМ НЕЙРОННОГО МАШИННОГО ПЕРЕКЛАДУ

Проблематика. На ринку існує не так багато компаній-розробників систем машинного перекладу (СМП), продукти яких користуються попитом. Це, наприклад, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” тощо. Існує потреба в упорядкованих і систематизованих методів розроблення СМП...

Full description

Bibliographic Details
Main Authors: Pavlo P. Maslianko, Yevhenii P. Sielskyi
Format: Article
Language:English
Published: Igor Sikorsky Kyiv Polytechnic Institute 2021-08-01
Series:KPI Science News
Subjects:
Online Access:http://scinews.kpi.ua/article/view/236939
Description
Summary:Проблематика. На ринку існує не так багато компаній-розробників систем машинного перекладу (СМП), продукти яких користуються попитом. Це, наприклад, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” тощо. Існує потреба в упорядкованих і систематизованих методів розроблення СМП, а також потрібні науково обґрунтовані методи інженерії систем нейронного машинного перекладу (СНМП), щоб якнайшвидше отримати якісний і конкурентоспроможний продукт. Мета дослідження. Застосувати бізнес-профіль Еріксона-Пенкера для розроблення та формалізації методу системної інженерії СНМП. Методика реалізації. Методологія системної інженерії і бізнес-профіль Еріксона-Пенкера для формалізації впорядкованого способу розроблення СНМП. Результати дослідження. Метод розроблення СНМП на основі застосування технік системної інженерії складається з трьох основних етапів. На першому етапі структуру СНМП моделюють як бізнес-профіль Еріксона-Пенкера, на другому – визначають множину процесів, характерну для класу систем Data Science та міжнародного стандарту CRISP-DM, а на третьому проводять верифікацію та валідацію розробленої СНМП. Висновки. Запропоновано метод системної інженерії СНМП, що базується на модифікованому бізнес-профілі Еріксона-Пенкера представлення системи на метарівні, а також міжнародних стандартів процесів DataScience та DataMining. Досліджено ефективність застосування методу на прикладі розроблення системи двоспрямованого англійсько-українського нейронного машинного перекладу EUMT (English-Ukrainian Machine Translator) і встановлено, що система EUMT щонайменше не поступається за якістю англійсько-українського перекладу популярному перекладачеві “GoogleTranslate”. Повний код версії системи EUMT опублікований на платформі GitHub та доступний за посиланням: https://github.com/EugeneSel/EUMT
ISSN:2617-5509
2663-7472