Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike
U ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme S...
Main Author: | |
---|---|
Format: | Article |
Language: | Croatian |
Published: |
Institut za hrvatski jezik i jezikoslovlje
2020-01-01
|
Series: | Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje |
Subjects: | |
Online Access: | https://hrcak.srce.hr/file/356627 |
_version_ | 1797207111981072384 |
---|---|
author | Irena Srdanović |
author_facet | Irena Srdanović |
author_sort | Irena Srdanović |
collection | DOAJ |
description | U ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme Sketch Engine za automatsko stvaranje specijaliziranih mrežnih korpusa (Baroni i dr. 2006, Kilgarriff i dr. 2014). Prvi pristup stvara korpus iz odabranih riječi, odn. polaznih pojmova (eng. <i>seed words</i>) koje su najrelevantnije za temu. Drugi pristup skuplja brojne mrežne stranice sa sadržajima o turizmu u određenim regijama, gradovima i mjestima u Hrvatskoj napisanim na japanskome jeziku, koje se zatim upotrebljavaju za stvaranje mrežnih korpusa. Oba pristupa pružaju specijalizirane internetske korpuse koji su, bez obzira na malu veličinu, korisni za profiliranje leksika u određenome području, u ovome slučaju u području turizma. U procesu stvaranja rječnika drugi se pristup pokazao osobito korisnim za odabir natuknica, dok su se oba pristupa pokazala vrlo korisnim za istraživanje i odabir autentičnih primjera iz korpusa. Uočeni su i određeni nedostatci u jezičnoj obradi podataka na japanskome jeziku, npr. pogreške u lematizaciji nekih pojmova i naziva svojstvenih određenoj kulturi te je ukazano na potrebu za usavršavanjem postojećih alata za jezičnu obradu podataka na japanskome jeziku. Japansko-hrvatski dvojezični rječnik namijenjen učenicima japanskoga jezika trenutačno je u eksperimentalnoj fazi te se učenici i nastavnici njime koriste i grade ga s pomoću otvorene platforme za izradu mrežnih rječnika Lexonomy (Mechura 2017). Osim što je rad na dvojezičnome rječniku koristan kao sredstvo za stručnu obuku u analizi i opisu jezika s pomoću suvremenih tehnologija (npr. korpusa, platforma za pretraživanje korpusa i izradu rječnika), važnost rječnika vidi se i u izobrazbi novih stručnjaka osposobljenih za rad u turizmu na japanskome jeziku, što je izrazito potrebno. U budućnosti bi se mogao primijeniti isti pristup za stvaranje specijaliziranih korpusa i rječnika za japanski i druge jezične parove. |
first_indexed | 2024-04-24T09:17:43Z |
format | Article |
id | doaj.art-01f028fe3fbd479286d270d005da4fb2 |
institution | Directory Open Access Journal |
issn | 1331-6745 1849-0379 |
language | Croatian |
last_indexed | 2024-04-24T09:17:43Z |
publishDate | 2020-01-01 |
publisher | Institut za hrvatski jezik i jezikoslovlje |
record_format | Article |
series | Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje |
spelling | doaj.art-01f028fe3fbd479286d270d005da4fb22024-04-15T16:30:52ZhrvInstitut za hrvatski jezik i jezikoslovljeRasprave Instituta za Hrvatski Jezik i Jezikoslovlje1331-67451849-03792020-01-014621059108310.31724/rihjj.46.2.31Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornikeIrena Srdanović0Juraj Dobrila University of PulaU ovom radu predstavljena su dva pristupa u stvaranju specijaliziranih mrežnih korpusa o hrvatskom turizmu na japanskome jeziku za potrebe izrade specijaliziranoga dvojezičnog japansko-hrvatskog rječnika za učenike japanskoga jezika. Oba pristupa koriste se tehnologijom WebBootCat unutar platforme Sketch Engine za automatsko stvaranje specijaliziranih mrežnih korpusa (Baroni i dr. 2006, Kilgarriff i dr. 2014). Prvi pristup stvara korpus iz odabranih riječi, odn. polaznih pojmova (eng. <i>seed words</i>) koje su najrelevantnije za temu. Drugi pristup skuplja brojne mrežne stranice sa sadržajima o turizmu u određenim regijama, gradovima i mjestima u Hrvatskoj napisanim na japanskome jeziku, koje se zatim upotrebljavaju za stvaranje mrežnih korpusa. Oba pristupa pružaju specijalizirane internetske korpuse koji su, bez obzira na malu veličinu, korisni za profiliranje leksika u određenome području, u ovome slučaju u području turizma. U procesu stvaranja rječnika drugi se pristup pokazao osobito korisnim za odabir natuknica, dok su se oba pristupa pokazala vrlo korisnim za istraživanje i odabir autentičnih primjera iz korpusa. Uočeni su i određeni nedostatci u jezičnoj obradi podataka na japanskome jeziku, npr. pogreške u lematizaciji nekih pojmova i naziva svojstvenih određenoj kulturi te je ukazano na potrebu za usavršavanjem postojećih alata za jezičnu obradu podataka na japanskome jeziku. Japansko-hrvatski dvojezični rječnik namijenjen učenicima japanskoga jezika trenutačno je u eksperimentalnoj fazi te se učenici i nastavnici njime koriste i grade ga s pomoću otvorene platforme za izradu mrežnih rječnika Lexonomy (Mechura 2017). Osim što je rad na dvojezičnome rječniku koristan kao sredstvo za stručnu obuku u analizi i opisu jezika s pomoću suvremenih tehnologija (npr. korpusa, platforma za pretraživanje korpusa i izradu rječnika), važnost rječnika vidi se i u izobrazbi novih stručnjaka osposobljenih za rad u turizmu na japanskome jeziku, što je izrazito potrebno. U budućnosti bi se mogao primijeniti isti pristup za stvaranje specijaliziranih korpusa i rječnika za japanski i druge jezične parove.https://hrcak.srce.hr/file/356627izgradnja korpusatehnologija BootCatpodručje turizmarječnik za neizvorne govornikeSketch Enginespecijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku |
spellingShingle | Irena Srdanović Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike Rasprave Instituta za Hrvatski Jezik i Jezikoslovlje izgradnja korpusa tehnologija BootCat područje turizma rječnik za neizvorne govornike Sketch Engine specijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku |
title | Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike |
title_full | Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike |
title_fullStr | Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike |
title_full_unstemmed | Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike |
title_short | Od specijaliziranih mrežnih korpusa do rječnika za neizvorne govornike |
title_sort | od specijaliziranih mreznih korpusa do rjecnika za neizvorne govornike |
topic | izgradnja korpusa tehnologija BootCat područje turizma rječnik za neizvorne govornike Sketch Engine specijalizirani mrežni korpus o hrvatskome turizmu na japanskome jeziku |
url | https://hrcak.srce.hr/file/356627 |
work_keys_str_mv | AT irenasrdanovic odspecijaliziranihmreznihkorpusadorjecnikazaneizvornegovornike |