El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya
En aquest article presentem el procés de compilació de la nova versió del corpus paral·lel català-castellà creat a partir dels textos del Diari Oficial de la Generalitat de Catalunya (DOGC). Es descriuen els processos de descàrrega, conversió a text, segmentació i alineació automàtica. Tots els pro...
Main Author: | |
---|---|
Format: | Article |
Language: | Catalan |
Published: |
Universidade do Minho & Universidade de Vigo
2023-01-01
|
Series: | Linguamática |
Subjects: | |
Online Access: | https://www.linguamatica.com/index.php/linguamatica/article/view/380 |