El corpus paral·lel del Diari Oficial de la Generalitat de Catalunya

En aquest article presentem el procés de compilació de la nova versió del corpus paral·lel català-castellà creat a partir dels textos del Diari Oficial de la Generalitat de Catalunya (DOGC). Es descriuen els processos de descàrrega, conversió a text, segmentació i alineació automàtica. Tots els pro...

Full description

Bibliographic Details
Main Author: Antoni Oliver González
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2023-01-01
Series:Linguamática
Subjects:
Online Access:https://www.linguamatica.com/index.php/linguamatica/article/view/380