Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai

Geokodavimas yra procesas, kai tekstinis vietos aprašas transformuojamas į geografi nes koordinates. Vienas iš dažniausiai naudojamų vietos aprašymo būdų yra pašto adresas, kurį sudaro gyvenvietės pavadinimas, gatvės pavadinimas, namo numeris ir kiti adreso elementai. Šiame straipsnyje nagrinėjamos...

Full description

Bibliographic Details
Main Author: Viktoras Paliulionis
Format: Article
Language:English
Published: Vilnius University Press 2009-01-01
Series:Informacijos Mokslai
Online Access:http://www.journals.vu.lt/informacijos-mokslai/article/view/3235
_version_ 1818012474611335168
author Viktoras Paliulionis
author_facet Viktoras Paliulionis
author_sort Viktoras Paliulionis
collection DOAJ
description Geokodavimas yra procesas, kai tekstinis vietos aprašas transformuojamas į geografi nes koordinates. Vienas iš dažniausiai naudojamų vietos aprašymo būdų yra pašto adresas, kurį sudaro gyvenvietės pavadinimas, gatvės pavadinimas, namo numeris ir kiti adreso elementai. Šiame straipsnyje nagrinėjamos lietuviškų adresų geokodavimo problemos, atsirandančios dėl adreso formatų įvairovės, netiksliai ir su rašybos klaidomis užrašomų adresų. Straipsnyje aprašyti geokodavimo proceso etapai ir juose naudojamų algoritmų principai. Pasiūlytas lietuvių kalbai pritaikytas LT-Soundex algoritmas, leidžiantis indeksuoti adreso elementus pagal fonetinį panašumą ir atlikti apytikslę paiešką. Lithuanian Address Geocoding: Problems and Solutions Viktoras Paliulionis Summary Geocoding is the process of converting of a textual description of a location into geographic coordinates. One of the most frequently used way to describe a place is its postal address that contains a city name, street name, house number and other address components. The paper deals with the problems of the geocoding of Lithuanian addresses. The main problems are variety of used address formats and possible typing and spelling errors. The paper describes the steps of the geocoding process and used algorithms. We propose a phonetic algorithm called LT-Soundex, adapted for the Lithuanian language and enabling to index addresses components by phonetic similarity and perform approximate address searching. It is used with Levenshtein distance for effective approximate address searching. ;">
first_indexed 2024-04-14T06:21:39Z
format Article
id doaj.art-a75d136f235348d58f837670c1345d8a
institution Directory Open Access Journal
issn 1392-0561
1392-1487
language English
last_indexed 2024-04-14T06:21:39Z
publishDate 2009-01-01
publisher Vilnius University Press
record_format Article
series Informacijos Mokslai
spelling doaj.art-a75d136f235348d58f837670c1345d8a2022-12-22T02:08:01ZengVilnius University PressInformacijos Mokslai1392-05611392-14872009-01-015010.15388/Im.2009.0.3235Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdaiViktoras PaliulionisGeokodavimas yra procesas, kai tekstinis vietos aprašas transformuojamas į geografi nes koordinates. Vienas iš dažniausiai naudojamų vietos aprašymo būdų yra pašto adresas, kurį sudaro gyvenvietės pavadinimas, gatvės pavadinimas, namo numeris ir kiti adreso elementai. Šiame straipsnyje nagrinėjamos lietuviškų adresų geokodavimo problemos, atsirandančios dėl adreso formatų įvairovės, netiksliai ir su rašybos klaidomis užrašomų adresų. Straipsnyje aprašyti geokodavimo proceso etapai ir juose naudojamų algoritmų principai. Pasiūlytas lietuvių kalbai pritaikytas LT-Soundex algoritmas, leidžiantis indeksuoti adreso elementus pagal fonetinį panašumą ir atlikti apytikslę paiešką. Lithuanian Address Geocoding: Problems and Solutions Viktoras Paliulionis Summary Geocoding is the process of converting of a textual description of a location into geographic coordinates. One of the most frequently used way to describe a place is its postal address that contains a city name, street name, house number and other address components. The paper deals with the problems of the geocoding of Lithuanian addresses. The main problems are variety of used address formats and possible typing and spelling errors. The paper describes the steps of the geocoding process and used algorithms. We propose a phonetic algorithm called LT-Soundex, adapted for the Lithuanian language and enabling to index addresses components by phonetic similarity and perform approximate address searching. It is used with Levenshtein distance for effective approximate address searching. ;">http://www.journals.vu.lt/informacijos-mokslai/article/view/3235
spellingShingle Viktoras Paliulionis
Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
Informacijos Mokslai
title Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
title_full Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
title_fullStr Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
title_full_unstemmed Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
title_short Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
title_sort lietuvisku adresu geokodavimo problemos ir ju sprendimo budai
url http://www.journals.vu.lt/informacijos-mokslai/article/view/3235
work_keys_str_mv AT viktoraspaliulionis lietuviskuadresugeokodavimoproblemosirjusprendimobudai