Corpus eletrônico de Documentos Históricos do Sertão

Resumo Este trabalho apresenta o Banco CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão, na sua primeira etapa, que abrange o período que vai de 1750 a 2000, caracterizado pelo multilinguismo localizado. O CE-DOHS é a versão eletrônica – com textos editados em linguagem xml – do ba...

Full description

Bibliographic Details
Main Authors: Zenaide de Oliveira Novais Carneiro, Mariana Fagundes de Oliveira Lacerda
Format: Article
Language:Spanish
Published: Universidade Estadual do Sudoeste da Bahia 2019-07-01
Series:Revista Binacional Brasil - Argentina
Subjects:
Online Access:https://periodicos2.uesb.br/index.php/rbba/article/view/5588
Description
Summary:Resumo Este trabalho apresenta o Banco CE-DOHS – Corpus Eletrônico de Documentos Históricos do Sertão, na sua primeira etapa, que abrange o período que vai de 1750 a 2000, caracterizado pelo multilinguismo localizado. O CE-DOHS é a versão eletrônica – com textos editados em linguagem xml – do banco DOHS, do projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro, com textos em edição semidiplomática, além de amostras orais. A edição eletrônica é feita, no âmbito do CE-DOHS, usando o eDictor, desenvolvido por Paixão de Sousa, Kepler e Faria (2010); trata-se de um editor de textos especialmente voltado ao trabalho filológico e à análise linguística automática. Finalizada a primeira etapa, no ano de 2018, o banco CE-DOHS tem mais de um milhão de palavras, colaborando, de maneira muito significativa, com o Projeto Nacional para a História do Português Brasileiro (PHPB), do qual é parceiro. Palavras-chave: Português Brasileiro. Banco de Dados. Edições Eletrônicas.   Resumen Este documento presenta el Banco EC-DOHS - Corpus de Documentación Electrónica de Sertão, en su primera etapa, que abarca el período de 1750 a 2000, caracterizado por el multilingüismo localizado. CE-DOHS es la versión electrónica, con textos editados en lenguaje XML, del banco DOHS, del proyecto Vozes do Sertão en Datos: historia, pueblos y formación del portugués brasileño, con textos en edición semidiplomática y muestras orales. La edición electrónica se realiza, en el marco de CE-DOHS, utilizando eDictor, desarrollado por Paixão de Sousa, Kepler y Faria (2010); Es un editor de texto enfocado especialmente en el trabajo filológico y el análisis lingüístico automático. Después de la primera fase, en 2018, el banco CE-DOHS tiene más de un millón de palabras, colaborando de manera muy significativa con el Proyecto Nacional de Historia del Portugués Brasileño (PHPB), del cual es socio. Palabras clave: Portugués brasileño. Banco de datos. Ediciones electrónicas.  
ISSN:2316-1205