Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai
Geokodavimas yra procesas, kai tekstinis vietos aprašas transformuojamas į geografi nes koordinates. Vienas iš dažniausiai naudojamų vietos aprašymo būdų yra pašto adresas, kurį sudaro gyvenvietės pavadinimas, gatvės pavadinimas, namo numeris ir kiti adreso elementai. Šiame straipsnyje nagrinėjamos...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Vilnius University Press
2009-01-01
|
Series: | Informacijos Mokslai |
Online Access: | http://www.journals.vu.lt/informacijos-mokslai/article/view/3235 |
_version_ | 1818012474611335168 |
---|---|
author | Viktoras Paliulionis |
author_facet | Viktoras Paliulionis |
author_sort | Viktoras Paliulionis |
collection | DOAJ |
description | Geokodavimas yra procesas, kai tekstinis vietos aprašas transformuojamas į geografi nes koordinates. Vienas iš dažniausiai naudojamų vietos aprašymo būdų yra pašto adresas, kurį sudaro gyvenvietės pavadinimas, gatvės pavadinimas, namo numeris ir kiti adreso elementai. Šiame straipsnyje nagrinėjamos lietuviškų adresų geokodavimo problemos, atsirandančios dėl adreso formatų įvairovės, netiksliai ir su rašybos klaidomis užrašomų adresų. Straipsnyje aprašyti geokodavimo proceso
etapai ir juose naudojamų algoritmų principai. Pasiūlytas lietuvių kalbai pritaikytas LT-Soundex algoritmas, leidžiantis indeksuoti adreso elementus pagal fonetinį panašumą ir atlikti apytikslę paiešką.
Lithuanian Address Geocoding: Problems and Solutions
Viktoras Paliulionis
Summary
Geocoding is the process of converting of a textual description of a location into geographic coordinates. One of the most frequently used way to describe a place is its postal address that contains a city name, street name, house number and other address components. The paper deals with the problems of the geocoding of Lithuanian addresses. The main problems are variety of used address formats and possible typing and spelling errors. The paper describes the steps of the geocoding process and used algorithms. We propose a phonetic algorithm called LT-Soundex, adapted for the Lithuanian language and enabling to index addresses components by phonetic similarity and perform approximate address searching. It is used with Levenshtein distance for effective approximate address searching.
;"> |
first_indexed | 2024-04-14T06:21:39Z |
format | Article |
id | doaj.art-a75d136f235348d58f837670c1345d8a |
institution | Directory Open Access Journal |
issn | 1392-0561 1392-1487 |
language | English |
last_indexed | 2024-04-14T06:21:39Z |
publishDate | 2009-01-01 |
publisher | Vilnius University Press |
record_format | Article |
series | Informacijos Mokslai |
spelling | doaj.art-a75d136f235348d58f837670c1345d8a2022-12-22T02:08:01ZengVilnius University PressInformacijos Mokslai1392-05611392-14872009-01-015010.15388/Im.2009.0.3235Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdaiViktoras PaliulionisGeokodavimas yra procesas, kai tekstinis vietos aprašas transformuojamas į geografi nes koordinates. Vienas iš dažniausiai naudojamų vietos aprašymo būdų yra pašto adresas, kurį sudaro gyvenvietės pavadinimas, gatvės pavadinimas, namo numeris ir kiti adreso elementai. Šiame straipsnyje nagrinėjamos lietuviškų adresų geokodavimo problemos, atsirandančios dėl adreso formatų įvairovės, netiksliai ir su rašybos klaidomis užrašomų adresų. Straipsnyje aprašyti geokodavimo proceso etapai ir juose naudojamų algoritmų principai. Pasiūlytas lietuvių kalbai pritaikytas LT-Soundex algoritmas, leidžiantis indeksuoti adreso elementus pagal fonetinį panašumą ir atlikti apytikslę paiešką. Lithuanian Address Geocoding: Problems and Solutions Viktoras Paliulionis Summary Geocoding is the process of converting of a textual description of a location into geographic coordinates. One of the most frequently used way to describe a place is its postal address that contains a city name, street name, house number and other address components. The paper deals with the problems of the geocoding of Lithuanian addresses. The main problems are variety of used address formats and possible typing and spelling errors. The paper describes the steps of the geocoding process and used algorithms. We propose a phonetic algorithm called LT-Soundex, adapted for the Lithuanian language and enabling to index addresses components by phonetic similarity and perform approximate address searching. It is used with Levenshtein distance for effective approximate address searching. ;">http://www.journals.vu.lt/informacijos-mokslai/article/view/3235 |
spellingShingle | Viktoras Paliulionis Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai Informacijos Mokslai |
title | Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai |
title_full | Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai |
title_fullStr | Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai |
title_full_unstemmed | Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai |
title_short | Lietuviškų adresų geokodavimo problemos ir jų sprendimo būdai |
title_sort | lietuvisku adresu geokodavimo problemos ir ju sprendimo budai |
url | http://www.journals.vu.lt/informacijos-mokslai/article/view/3235 |
work_keys_str_mv | AT viktoraspaliulionis lietuviskuadresugeokodavimoproblemosirjusprendimobudai |