Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike

U ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme S...

Full description

Bibliographic Details
Main Author: Irena Srdanović
Format: Article
Language:Croatian
Published: Institut za hrvatski jezik i jezikoslovlje 2020-01-01
Series:Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje
Subjects:
Online Access:https://hrcak.srce.hr/file/356627
_version_ 1797207111981072384
author Irena Srdanović
author_facet Irena Srdanović
author_sort Irena Srdanović
collection DOAJ
description U ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme Sketch Engine za automatsko stvaranje specijaliziranih mrežnih korpusa (Baroni i dr. 2006, Kilgarriff i dr. 2014). Prvi pristup stvara korpus iz odabranih riječi, odn. polaznih pojmova (eng. <i>seed words</i>) koje su najrelevantnije za temu. Drugi pristup skuplja brojne mrežne stranice sa sadržajima o turizmu u određenim regijama, gradovima i mjestima u Hrvatskoj napisanim na japanskome jeziku, koje se zatim upotrebljavaju za stvaranje mrežnih korpusa. Oba pristupa pružaju specijalizirane internetske korpuse koji su, bez obzira na malu veličinu, korisni za profiliranje leksika u određenome području, u ovome slučaju u području turizma. U procesu stvaranja rječnika drugi se pristup pokazao osobito korisnim za odabir natuknica, dok su se oba pristupa pokazala vrlo korisnim za istraživanje i odabir autentičnih primjera iz korpusa. Uočeni su i određeni nedostatci u jezičnoj obradi podataka na japanskome jeziku, npr. pogreške u lematizaciji nekih pojmova i naziva svojstvenih određenoj kulturi te je ukazano na potrebu za usavršavanjem postojećih alata za jezičnu obradu podataka na japanskome jeziku. Japansko-hrvatski dvojezični rječnik namijenjen učenicima japanskoga jezika trenutačno je u eksperimentalnoj fazi te se učenici i nastavnici njime koriste i grade ga s pomoću otvorene platforme za izradu mrežnih rječnika Lexonomy (Mechura 2017). Osim što je rad na dvojezičnome rječniku koristan kao sredstvo za stručnu obuku u analizi i opisu jezika s pomoću suvremenih tehnologija (npr. korpusa, platforma za pretraživanje korpusa i izradu rječnika), važnost rječnika vidi se i u izobrazbi novih stručnjaka osposobljenih za rad u turizmu na japanskome jeziku, što je izrazito potrebno. U budućnosti bi se mogao primijeniti isti pristup za stvaranje specijaliziranih korpusa i rječnika za japanski i druge jezične parove.
first_indexed 2024-04-24T09:17:43Z
format Article
id doaj.art-01f028fe3fbd479286d270d005da4fb2
institution Directory Open Access Journal
issn 1331-6745
1849-0379
language Croatian
last_indexed 2024-04-24T09:17:43Z
publishDate 2020-01-01
publisher Institut za hrvatski jezik i jezikoslovlje
record_format Article
series Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje
spelling doaj.art-01f028fe3fbd479286d270d005da4fb22024-04-15T16:30:52ZhrvInstitut za hrvatski jezik i jezikoslovljeRasprave Instituta za Hrvatski Jezik i Jezikoslovlje1331-67451849-03792020-01-014621059108310.31724/rihjj.46.2.31Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornikeIrena Srdanović0Juraj Dobrila University of PulaU ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme Sketch Engine za automatsko stvaranje specijaliziranih mrežnih korpusa (Baroni i dr. 2006, Kilgarriff i dr. 2014). Prvi pristup stvara korpus iz odabranih riječi, odn. polaznih pojmova (eng. <i>seed words</i>) koje su najrelevantnije za temu. Drugi pristup skuplja brojne mrežne stranice sa sadržajima o turizmu u određenim regijama, gradovima i mjestima u Hrvatskoj napisanim na japanskome jeziku, koje se zatim upotrebljavaju za stvaranje mrežnih korpusa. Oba pristupa pružaju specijalizirane internetske korpuse koji su, bez obzira na malu veličinu, korisni za profiliranje leksika u određenome području, u ovome slučaju u području turizma. U procesu stvaranja rječnika drugi se pristup pokazao osobito korisnim za odabir natuknica, dok su se oba pristupa pokazala vrlo korisnim za istraživanje i odabir autentičnih primjera iz korpusa. Uočeni su i određeni nedostatci u jezičnoj obradi podataka na japanskome jeziku, npr. pogreške u lematizaciji nekih pojmova i naziva svojstvenih određenoj kulturi te je ukazano na potrebu za usavršavanjem postojećih alata za jezičnu obradu podataka na japanskome jeziku. Japansko-hrvatski dvojezični rječnik namijenjen učenicima japanskoga jezika trenutačno je u eksperimentalnoj fazi te se učenici i nastavnici njime koriste i grade ga s pomoću otvorene platforme za izradu mrežnih rječnika Lexonomy (Mechura 2017). Osim što je rad na dvojezičnome rječniku koristan kao sredstvo za stručnu obuku u analizi i opisu jezika s pomoću suvremenih tehnologija (npr. korpusa, platforma za pretraživanje korpusa i izradu rječnika), važnost rječnika vidi se i u izobrazbi novih stručnjaka osposobljenih za rad u turizmu na japanskome jeziku, što je izrazito potrebno. U budućnosti bi se mogao primijeniti isti pristup za stvaranje specijaliziranih korpusa i rječnika za japanski i druge jezične parove.https://hrcak.srce.hr/file/356627izgradnja korpusatehnologija BootCatpodručje turizmarječnik za neizvorne govornikeSketch Enginespecijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku
spellingShingle Irena Srdanović
Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje
izgradnja korpusa
tehnologija BootCat
područje turizma
rječnik za neizvorne govornike
Sketch Engine
specijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku
title Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
title_full Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
title_fullStr Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
title_full_unstemmed Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
title_short Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
title_sort od specijaliziranih mreznih korpusa do rjecnika za neizvorne govornike
topic izgradnja korpusa
tehnologija BootCat
područje turizma
rječnik za neizvorne govornike
Sketch Engine
specijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku
url https://hrcak.srce.hr/file/356627
work_keys_str_mv AT irenasrdanovic odspecijaliziranihmreznihkorpusadorjecnikazaneizvornegovornike