RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE

RESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utiliz...

Full description

Bibliographic Details
Main Authors: Maria José Bocorny FINATTO, Oto Araújo VALE, Éric LAPORTE
Format: Article
Language:English
Published: Universidade Estadual Paulista Júlio de Mesquita Filho
Series:Alfa: Revista de Lingüística
Subjects:
Online Access:http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1981-57942019000100063&lng=en&tlng=en
_version_ 1818573576597405696
author Maria José Bocorny FINATTO
Oto Araújo VALE
Éric LAPORTE
author_facet Maria José Bocorny FINATTO
Oto Araújo VALE
Éric LAPORTE
author_sort Maria José Bocorny FINATTO
collection DOAJ
description RESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utilizado em análises linguísticas do Português do Brasil e em outras pesquisas, o que justifica um estudo crítico. O universo vocabular provém do corpus PorPopular, composto por jornais populares, o Diário Gaúcho (DG) e o jornal baiano Massa ! (MA). Do DG, partiu-se de um conjunto de textos com 984.465 palavras ( tokens) , publicados em 2008, com ortografia desatualizada frente ao Acordo Ortográfico da Língua Portuguesa adotado em 2009. Do MA, examinou-se um universo com 215.776 palavras ( tokens) , em publicações de 2012, 2014 e 2015, com todo o material na nova ortografia. A verificação envolveu: a) gerar listas de palavras diferentes empregadas em DG e MA; b) comparar essas listas com as listas de entradas das duas versões do DELAF PB; c) avaliar a cobertura desse vocabulário; d) propor modos de inclusão de itens não cobertos. Os resultados do trabalho mostraram, no DG, uma média de 19% de palavras diferentes ( types) desconhecidas pelos DELAF PB 2004 e 2015. No MA, essa média ficou em 13%. A versão do dicionário repercutiu ligeiramente sobre o desempenho do reconhecimento de itens.
first_indexed 2024-12-15T00:13:11Z
format Article
id doaj.art-2da7d94214884d6689d3528e167ca093
institution Directory Open Access Journal
issn 1981-5794
language English
last_indexed 2024-12-15T00:13:11Z
publisher Universidade Estadual Paulista Júlio de Mesquita Filho
record_format Article
series Alfa: Revista de Lingüística
spelling doaj.art-2da7d94214884d6689d3528e167ca0932022-12-21T22:42:31ZengUniversidade Estadual Paulista Júlio de Mesquita FilhoAlfa: Revista de Lingüística1981-5794631638010.1590/1981-5794-1904-3S1981-57942019000100063RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVREMaria José Bocorny FINATTOOto Araújo VALEÉric LAPORTERESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utilizado em análises linguísticas do Português do Brasil e em outras pesquisas, o que justifica um estudo crítico. O universo vocabular provém do corpus PorPopular, composto por jornais populares, o Diário Gaúcho (DG) e o jornal baiano Massa ! (MA). Do DG, partiu-se de um conjunto de textos com 984.465 palavras ( tokens) , publicados em 2008, com ortografia desatualizada frente ao Acordo Ortográfico da Língua Portuguesa adotado em 2009. Do MA, examinou-se um universo com 215.776 palavras ( tokens) , em publicações de 2012, 2014 e 2015, com todo o material na nova ortografia. A verificação envolveu: a) gerar listas de palavras diferentes empregadas em DG e MA; b) comparar essas listas com as listas de entradas das duas versões do DELAF PB; c) avaliar a cobertura desse vocabulário; d) propor modos de inclusão de itens não cobertos. Os resultados do trabalho mostraram, no DG, uma média de 19% de palavras diferentes ( types) desconhecidas pelos DELAF PB 2004 e 2015. No MA, essa média ficou em 13%. A versão do dicionário repercutiu ligeiramente sobre o desempenho do reconhecimento de itens.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1981-57942019000100063&lng=en&tlng=enJornais popularesLéxicoVocabulárioDicionário computacionalCobertura lexicalReconhecimento de palavrasPortuguês brasileiro
spellingShingle Maria José Bocorny FINATTO
Oto Araújo VALE
Éric LAPORTE
RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
Alfa: Revista de Lingüística
Jornais populares
Léxico
Vocabulário
Dicionário computacional
Cobertura lexical
Reconhecimento de palavras
Português brasileiro
title RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
title_full RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
title_fullStr RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
title_full_unstemmed RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
title_short RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
title_sort reconhecimento do vocabulario de jornais populares brasileiros por um dicionario computacional de acesso livre
topic Jornais populares
Léxico
Vocabulário
Dicionário computacional
Cobertura lexical
Reconhecimento de palavras
Português brasileiro
url http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1981-57942019000100063&lng=en&tlng=en
work_keys_str_mv AT mariajosebocornyfinatto reconhecimentodovocabulariodejornaispopularesbrasileirosporumdicionariocomputacionaldeacessolivre
AT otoaraujovale reconhecimentodovocabulariodejornaispopularesbrasileirosporumdicionariocomputacionaldeacessolivre
AT ericlaporte reconhecimentodovocabulariodejornaispopularesbrasileirosporumdicionariocomputacionaldeacessolivre