Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
Večina sodobnih sistemov za strojno prevajanje temelji na arhitekturi nevronskih mrež. To velja za spletne ponudnike strojnega prevajanja, za raziskovalne sisteme in za orodja, ki so lahko v pomoč poklicnim prevajalcem v njihovi praksi. Čeprav lahko sisteme nevronskih mrež uporabljamo na običajnih...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
University of Ljubljana Press (Založba Univerze v Ljubljani)
2023-09-01
|
Series: | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave |
Subjects: | |
Online Access: | https://journals.uni-lj.si/slovenscina2/article/view/12025 |
_version_ | 1827193598160928768 |
---|---|
author | Gregor Donaj Mirjam Sepesy Maučec |
author_facet | Gregor Donaj Mirjam Sepesy Maučec |
author_sort | Gregor Donaj |
collection | DOAJ |
description |
Večina sodobnih sistemov za strojno prevajanje temelji na arhitekturi nevronskih mrež. To velja za spletne ponudnike strojnega prevajanja, za raziskovalne sisteme in za orodja, ki so lahko v pomoč poklicnim prevajalcem v njihovi praksi. Čeprav lahko sisteme nevronskih mrež uporabljamo na običajnih centralnih procesnih enotah osebnih računalnikov in strežnikov, je za delovanje s smiselno hitrostjo potrebna uporaba grafičnih procesnih enot. Pri tem smo omejeni z velikostjo slovarja, kar zmanjšuje kakovost prevodov. Velikost slovarja besednih enot je še posebej pereč problem visoko pregibnih jezikov. Rešujemo ga z uporabo podbesednih enot, s katerimi dosežemo večjo pokritost jezika. V članku predstavljamo različne metode razcepljanja besed na podbesedne enote z različno velikimi slovarji in primerjamo njihovo uporabo v strojnem prevajalniku za jezikovni par slovenščina-angleščina. V primerjavo vključujemo še prevajalnik brez razcepljanja besed. Predstavljamo rezultate uspešnosti prevajanja z metriko BLEU, hitrosti učenja modelov in hitrosti prevajanja ter velikosti modelov. Dodajamo pregled praktičnih vidikov uporabe podbesednih enot v strojnem prevajalniku, ki ga uporabljamo skupaj z orodji za računalniško podprto prevajanje.
|
first_indexed | 2024-04-24T16:36:55Z |
format | Article |
id | doaj.art-250eea565e2643df9f1ab8ccb4ac964d |
institution | Directory Open Access Journal |
issn | 2335-2736 |
language | English |
last_indexed | 2025-03-21T09:00:05Z |
publishDate | 2023-09-01 |
publisher | University of Ljubljana Press (Založba Univerze v Ljubljani) |
record_format | Article |
series | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave |
spelling | doaj.art-250eea565e2643df9f1ab8ccb4ac964d2024-07-10T08:31:15ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362023-09-0111110.4312/slo2.0.2023.1.275-30118412Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščinaGregor Donaj0https://orcid.org/0000-0002-0297-2714Mirjam Sepesy Maučec1Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatikoUniverza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko Večina sodobnih sistemov za strojno prevajanje temelji na arhitekturi nevronskih mrež. To velja za spletne ponudnike strojnega prevajanja, za raziskovalne sisteme in za orodja, ki so lahko v pomoč poklicnim prevajalcem v njihovi praksi. Čeprav lahko sisteme nevronskih mrež uporabljamo na običajnih centralnih procesnih enotah osebnih računalnikov in strežnikov, je za delovanje s smiselno hitrostjo potrebna uporaba grafičnih procesnih enot. Pri tem smo omejeni z velikostjo slovarja, kar zmanjšuje kakovost prevodov. Velikost slovarja besednih enot je še posebej pereč problem visoko pregibnih jezikov. Rešujemo ga z uporabo podbesednih enot, s katerimi dosežemo večjo pokritost jezika. V članku predstavljamo različne metode razcepljanja besed na podbesedne enote z različno velikimi slovarji in primerjamo njihovo uporabo v strojnem prevajalniku za jezikovni par slovenščina-angleščina. V primerjavo vključujemo še prevajalnik brez razcepljanja besed. Predstavljamo rezultate uspešnosti prevajanja z metriko BLEU, hitrosti učenja modelov in hitrosti prevajanja ter velikosti modelov. Dodajamo pregled praktičnih vidikov uporabe podbesednih enot v strojnem prevajalniku, ki ga uporabljamo skupaj z orodji za računalniško podprto prevajanje. https://journals.uni-lj.si/slovenscina2/article/view/12025strojno prevajanjevelikost slovarjapodbesedne enotegrafične procesne enote |
spellingShingle | Gregor Donaj Mirjam Sepesy Maučec Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave strojno prevajanje velikost slovarja podbesedne enote grafične procesne enote |
title | Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina |
title_full | Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina |
title_fullStr | Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina |
title_full_unstemmed | Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina |
title_short | Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina |
title_sort | prakticni vidiki uporabe podbesednih enot v strojnem prevajanju slovenscina anglescina |
topic | strojno prevajanje velikost slovarja podbesedne enote grafične procesne enote |
url | https://journals.uni-lj.si/slovenscina2/article/view/12025 |
work_keys_str_mv | AT gregordonaj prakticnividikiuporabepodbesednihenotvstrojnemprevajanjuslovenscinaanglescina AT mirjamsepesymaucec prakticnividikiuporabepodbesednihenotvstrojnemprevajanjuslovenscinaanglescina |