Senųjų raštų rašybos keitimas paieškos sistemai

[straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba] Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji ra...

Full description

Bibliographic Details
Main Author: Mindaugas Šinkūnas
Format: Article
Language:English
Published: Vilnius University Press 2018-12-01
Series:Vilnius University Open Series
Subjects:
Online Access:https://www.journals.vu.lt/open-series/article/view/12999
_version_ 1811311178641571840
author Mindaugas Šinkūnas
author_facet Mindaugas Šinkūnas
author_sort Mindaugas Šinkūnas
collection DOAJ
description [straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba] Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji rašyba dažnai yra variantiška, nenusistovėjusi ir gerokai skiriasi nuo dabartinės, tai trukdo pritaikyti technologijas, kuriamas dabartinei lietuvių kalbai tirti. Straipsnyje aprašomas empirinėmis taisyklėmis paremtas būdas iš žodžių formų senąja rašyba automatiškai sugeneruoti formas dabartine rašyba perraše išlaikant originalios rašybos ypatybes. Sugeneruoti atitikmenys naudojami paieškos sistemoje.
first_indexed 2024-04-13T10:13:13Z
format Article
id doaj.art-995ed0796ef34501a4b882673a272524
institution Directory Open Access Journal
issn 2669-0535
language English
last_indexed 2024-04-13T10:13:13Z
publishDate 2018-12-01
publisher Vilnius University Press
record_format Article
series Vilnius University Open Series
spelling doaj.art-995ed0796ef34501a4b882673a2725242022-12-22T02:50:50ZengVilnius University PressVilnius University Open Series2669-05352018-12-01110.15388/Proceedings.2018.16Senųjų raštų rašybos keitimas paieškos sistemaiMindaugas Šinkūnas0Lietuvių kalbos institutas[straipsnis ir santrauka lietuvių kalba; santrauka anglų kalba] Lingvistinei analizei reikia skaitmeninių tekstų, tinkamų programiniam apdorojimui. Lietuvių kalbos instituto duomenų bazei senieji raštai skaitmeninami laikantis dokumentinio perrašo principų, nekeičiant originalo rašybos. Senoji rašyba dažnai yra variantiška, nenusistovėjusi ir gerokai skiriasi nuo dabartinės, tai trukdo pritaikyti technologijas, kuriamas dabartinei lietuvių kalbai tirti. Straipsnyje aprašomas empirinėmis taisyklėmis paremtas būdas iš žodžių formų senąja rašyba automatiškai sugeneruoti formas dabartine rašyba perraše išlaikant originalios rašybos ypatybes. Sugeneruoti atitikmenys naudojami paieškos sistemoje.https://www.journals.vu.lt/open-series/article/view/12999tekstynų lingvistikarašybosortografijos normalizavimasnormalizacijareguliacijatransliteracija
spellingShingle Mindaugas Šinkūnas
Senųjų raštų rašybos keitimas paieškos sistemai
Vilnius University Open Series
tekstynų lingvistika
rašybos
ortografijos normalizavimas
normalizacija
reguliacija
transliteracija
title Senųjų raštų rašybos keitimas paieškos sistemai
title_full Senųjų raštų rašybos keitimas paieškos sistemai
title_fullStr Senųjų raštų rašybos keitimas paieškos sistemai
title_full_unstemmed Senųjų raštų rašybos keitimas paieškos sistemai
title_short Senųjų raštų rašybos keitimas paieškos sistemai
title_sort senuju rastu rasybos keitimas paieskos sistemai
topic tekstynų lingvistika
rašybos
ortografijos normalizavimas
normalizacija
reguliacija
transliteracija
url https://www.journals.vu.lt/open-series/article/view/12999
work_keys_str_mv AT mindaugassinkunas senujurasturasyboskeitimaspaieskossistemai