Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina

Večina sodobnih sistemov za strojno prevajanje temelji na arhitekturi nevronskih mrež. To velja za spletne ponudnike strojnega prevajanja, za raziskovalne sisteme in za orodja, ki so lahko v pomoč poklicnim prevajalcem v njihovi praksi. Čeprav lahko sisteme nevronskih mrež uporabljamo na običajnih...

Full description

Bibliographic Details
Main Authors: Gregor Donaj, Mirjam Sepesy Maučec
Format: Article
Language:English
Published: University of Ljubljana Press (Založba Univerze v Ljubljani) 2023-09-01
Series:Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
Subjects:
Online Access:https://journals.uni-lj.si/slovenscina2/article/view/12025
_version_ 1827193598160928768
author Gregor Donaj
Mirjam Sepesy Maučec
author_facet Gregor Donaj
Mirjam Sepesy Maučec
author_sort Gregor Donaj
collection DOAJ
description Večina sodobnih sistemov za strojno prevajanje temelji na arhitekturi nevronskih mrež. To velja za spletne ponudnike strojnega prevajanja, za raziskovalne sisteme in za orodja, ki so lahko v pomoč poklicnim prevajalcem v njihovi praksi. Čeprav lahko sisteme nevronskih mrež uporabljamo na običajnih centralnih procesnih enotah osebnih računalnikov in strežnikov, je za delovanje s smiselno hitrostjo potrebna uporaba grafičnih procesnih enot. Pri tem smo omejeni z velikostjo slovarja, kar zmanjšuje kakovost prevodov. Velikost slovarja besednih enot je še posebej pereč problem visoko pregibnih jezikov. Rešujemo ga z uporabo podbesednih enot, s katerimi dosežemo večjo pokritost jezika. V članku predstavljamo različne metode razcepljanja besed na podbesedne enote z različno velikimi slovarji in primerjamo njihovo uporabo v strojnem prevajalniku za jezikovni par slovenščina-angleščina. V primerjavo vključujemo še prevajalnik brez razcepljanja besed. Predstavljamo rezultate uspešnosti prevajanja z metriko BLEU, hitrosti učenja modelov in hitrosti prevajanja ter velikosti modelov. Dodajamo pregled praktičnih vidikov uporabe podbesednih enot v strojnem prevajalniku, ki ga uporabljamo skupaj z orodji za računalniško podprto prevajanje.
first_indexed 2024-04-24T16:36:55Z
format Article
id doaj.art-250eea565e2643df9f1ab8ccb4ac964d
institution Directory Open Access Journal
issn 2335-2736
language English
last_indexed 2025-03-21T09:00:05Z
publishDate 2023-09-01
publisher University of Ljubljana Press (Založba Univerze v Ljubljani)
record_format Article
series Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
spelling doaj.art-250eea565e2643df9f1ab8ccb4ac964d2024-07-10T08:31:15ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362023-09-0111110.4312/slo2.0.2023.1.275-30118412Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščinaGregor Donaj0https://orcid.org/0000-0002-0297-2714Mirjam Sepesy Maučec1Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatikoUniverza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko Večina sodobnih sistemov za strojno prevajanje temelji na arhitekturi nevronskih mrež. To velja za spletne ponudnike strojnega prevajanja, za raziskovalne sisteme in za orodja, ki so lahko v pomoč poklicnim prevajalcem v njihovi praksi. Čeprav lahko sisteme nevronskih mrež uporabljamo na običajnih centralnih procesnih enotah osebnih računalnikov in strežnikov, je za delovanje s smiselno hitrostjo potrebna uporaba grafičnih procesnih enot. Pri tem smo omejeni z velikostjo slovarja, kar zmanjšuje kakovost prevodov. Velikost slovarja besednih enot je še posebej pereč problem visoko pregibnih jezikov. Rešujemo ga z uporabo podbesednih enot, s katerimi dosežemo večjo pokritost jezika. V članku predstavljamo različne metode razcepljanja besed na podbesedne enote z različno velikimi slovarji in primerjamo njihovo uporabo v strojnem prevajalniku za jezikovni par slovenščina-angleščina. V primerjavo vključujemo še prevajalnik brez razcepljanja besed. Predstavljamo rezultate uspešnosti prevajanja z metriko BLEU, hitrosti učenja modelov in hitrosti prevajanja ter velikosti modelov. Dodajamo pregled praktičnih vidikov uporabe podbesednih enot v strojnem prevajalniku, ki ga uporabljamo skupaj z orodji za računalniško podprto prevajanje. https://journals.uni-lj.si/slovenscina2/article/view/12025strojno prevajanjevelikost slovarjapodbesedne enotegrafične procesne enote
spellingShingle Gregor Donaj
Mirjam Sepesy Maučec
Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
strojno prevajanje
velikost slovarja
podbesedne enote
grafične procesne enote
title Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
title_full Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
title_fullStr Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
title_full_unstemmed Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
title_short Praktični vidiki uporabe podbesednih enot v strojnem prevajanju slovenščina-angleščina
title_sort prakticni vidiki uporabe podbesednih enot v strojnem prevajanju slovenscina anglescina
topic strojno prevajanje
velikost slovarja
podbesedne enote
grafične procesne enote
url https://journals.uni-lj.si/slovenscina2/article/view/12025
work_keys_str_mv AT gregordonaj prakticnividikiuporabepodbesednihenotvstrojnemprevajanjuslovenscinaanglescina
AT mirjamsepesymaucec prakticnividikiuporabepodbesednihenotvstrojnemprevajanjuslovenscinaanglescina