Senųjų raštų rašybos keitimas paieškos sistemai
[straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba] Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji ra...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Vilnius University Press
2018-12-01
|
Series: | Vilnius University Open Series |
Subjects: | |
Online Access: | https://www.journals.vu.lt/open-series/article/view/12999 |
_version_ | 1811311178641571840 |
---|---|
author | Mindaugas Šinkūnas |
author_facet | Mindaugas Šinkūnas |
author_sort | Mindaugas Šinkūnas |
collection | DOAJ |
description | [straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba]
Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji rašyba dažnai yra variantiška, nenusistovėjusi ir gerokai skiriasi nuo dabartinės, tai trukdo pritaikyti technologijas, kuriamas dabartinei lietuvių kalbai tirti. Straipsnyje aprašomas empirinėmis taisyklėmis paremtas būdas iš žodžių formų senąja rašyba automatiškai sugeneruoti formas dabartine rašyba perraše išlaikant originalios rašybos ypatybes. Sugeneruoti atitikmenys naudojami paieškos sistemoje. |
first_indexed | 2024-04-13T10:13:13Z |
format | Article |
id | doaj.art-995ed0796ef34501a4b882673a272524 |
institution | Directory Open Access Journal |
issn | 2669-0535 |
language | English |
last_indexed | 2024-04-13T10:13:13Z |
publishDate | 2018-12-01 |
publisher | Vilnius University Press |
record_format | Article |
series | Vilnius University Open Series |
spelling | doaj.art-995ed0796ef34501a4b882673a2725242022-12-22T02:50:50ZengVilnius University PressVilnius University Open Series2669-05352018-12-01110.15388/Proceedings.2018.16Senųjų raštų rašybos keitimas paieškos sistemaiMindaugas Šinkūnas0Lietuvių kalbos institutas[straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba] Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji rašyba dažnai yra variantiška, nenusistovėjusi ir gerokai skiriasi nuo dabartinės, tai trukdo pritaikyti technologijas, kuriamas dabartinei lietuvių kalbai tirti. Straipsnyje aprašomas empirinėmis taisyklėmis paremtas būdas iš žodžių formų senąja rašyba automatiškai sugeneruoti formas dabartine rašyba perraše išlaikant originalios rašybos ypatybes. Sugeneruoti atitikmenys naudojami paieškos sistemoje.https://www.journals.vu.lt/open-series/article/view/12999tekstynų lingvistikarašybosortografijos normalizavimasnormalizacijareguliacijatransliteracija |
spellingShingle | Mindaugas Šinkūnas Senųjų raštų rašybos keitimas paieškos sistemai Vilnius University Open Series tekstynų lingvistika rašybos ortografijos normalizavimas normalizacija reguliacija transliteracija |
title | Senųjų raštų rašybos keitimas paieškos sistemai |
title_full | Senųjų raštų rašybos keitimas paieškos sistemai |
title_fullStr | Senųjų raštų rašybos keitimas paieškos sistemai |
title_full_unstemmed | Senųjų raštų rašybos keitimas paieškos sistemai |
title_short | Senųjų raštų rašybos keitimas paieškos sistemai |
title_sort | senuju rastu rasybos keitimas paieskos sistemai |
topic | tekstynų lingvistika rašybos ortografijos normalizavimas normalizacija reguliacija transliteracija |
url | https://www.journals.vu.lt/open-series/article/view/12999 |
work_keys_str_mv | AT mindaugassinkunas senujurasturasyboskeitimaspaieskossistemai |