Spremljevalni korpus Trendi in avtomatska kategorizacija

Prispevek predstavlja izdelavo korpusa Trendi, prvega spremljevalnega korpusa za slovenščino. Trenutna različica Trendi 2023-02 pokriva besedila od januarja 2019 do konca februarja 2023, vsebuje pa že več kot 700 milijonov pojavnic oz. več kot 586 milijonov besed. Namen korpusa je, da tako strokovn...

Full description

Bibliographic Details
Main Authors: Iztok Kosem, Jaka Čibej, Kaja Dobrovoljc, Taja Kuzman, Nikola Ljubešić
Format: Article
Language:English
Published: University of Ljubljana Press (Založba Univerze v Ljubljani) 2023-09-01
Series:Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
Subjects:
Online Access:https://journals-test.uni-lj.si/slovenscina2/article/view/12073