МЕТОД СИСТЕМНОЇ ІНЖЕНЕРІЇ СИСТЕМ НЕЙРОННОГО МАШИННОГО ПЕРЕКЛАДУ
Проблематика. На ринку існує не так багато компаній-розробників систем машинного перекладу (СМП), продукти яких користуються попитом. Це, наприклад, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” тощо. Існує потреба в упорядкованих і систематизованих методів розроблення СМП...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Igor Sikorsky Kyiv Polytechnic Institute
2021-08-01
|
Series: | KPI Science News |
Subjects: | |
Online Access: | http://scinews.kpi.ua/article/view/236939 |
Summary: | Проблематика. На ринку існує не так багато компаній-розробників систем машинного перекладу (СМП), продукти яких користуються попитом. Це, наприклад, “GoogleTranslate”, “DeepLTranslator”, “ModernMT”, “Apertium”, “Trident” тощо. Існує потреба в упорядкованих і систематизованих методів розроблення СМП, а також потрібні науково обґрунтовані методи інженерії систем нейронного машинного перекладу (СНМП), щоб якнайшвидше отримати якісний і конкурентоспроможний продукт.
Мета дослідження. Застосувати бізнес-профіль Еріксона-Пенкера для розроблення та формалізації методу системної інженерії СНМП.
Методика реалізації. Методологія системної інженерії і бізнес-профіль Еріксона-Пенкера для формалізації впорядкованого способу розроблення СНМП.
Результати дослідження. Метод розроблення СНМП на основі застосування технік системної інженерії складається з трьох основних етапів. На першому етапі структуру СНМП моделюють як бізнес-профіль Еріксона-Пенкера, на другому – визначають множину процесів, характерну для класу систем Data Science та міжнародного стандарту CRISP-DM, а на третьому проводять верифікацію та валідацію розробленої СНМП.
Висновки. Запропоновано метод системної інженерії СНМП, що базується на модифікованому бізнес-профілі Еріксона-Пенкера представлення системи на метарівні, а також міжнародних стандартів процесів DataScience та DataMining. Досліджено ефективність застосування методу на прикладі розроблення системи двоспрямованого англійсько-українського нейронного машинного перекладу EUMT (English-Ukrainian Machine Translator) і встановлено, що система EUMT щонайменше не поступається за якістю англійсько-українського перекладу популярному перекладачеві “GoogleTranslate”. Повний код версії системи EUMT опублікований на платформі GitHub та доступний за посиланням: https://github.com/EugeneSel/EUMT
|
---|---|
ISSN: | 2617-5509 2663-7472 |