RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE
RESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utiliz...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidade Estadual Paulista Júlio de Mesquita Filho
|
Series: | Alfa: Revista de Lingüística |
Subjects: | |
Online Access: | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1981-57942019000100063&lng=en&tlng=en |
_version_ | 1818573576597405696 |
---|---|
author | Maria José Bocorny FINATTO Oto Araújo VALE Éric LAPORTE |
author_facet | Maria José Bocorny FINATTO Oto Araújo VALE Éric LAPORTE |
author_sort | Maria José Bocorny FINATTO |
collection | DOAJ |
description | RESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utilizado em análises linguísticas do Português do Brasil e em outras pesquisas, o que justifica um estudo crítico. O universo vocabular provém do corpus PorPopular, composto por jornais populares, o Diário Gaúcho (DG) e o jornal baiano Massa ! (MA). Do DG, partiu-se de um conjunto de textos com 984.465 palavras ( tokens) , publicados em 2008, com ortografia desatualizada frente ao Acordo Ortográfico da Língua Portuguesa adotado em 2009. Do MA, examinou-se um universo com 215.776 palavras ( tokens) , em publicações de 2012, 2014 e 2015, com todo o material na nova ortografia. A verificação envolveu: a) gerar listas de palavras diferentes empregadas em DG e MA; b) comparar essas listas com as listas de entradas das duas versões do DELAF PB; c) avaliar a cobertura desse vocabulário; d) propor modos de inclusão de itens não cobertos. Os resultados do trabalho mostraram, no DG, uma média de 19% de palavras diferentes ( types) desconhecidas pelos DELAF PB 2004 e 2015. No MA, essa média ficou em 13%. A versão do dicionário repercutiu ligeiramente sobre o desempenho do reconhecimento de itens. |
first_indexed | 2024-12-15T00:13:11Z |
format | Article |
id | doaj.art-2da7d94214884d6689d3528e167ca093 |
institution | Directory Open Access Journal |
issn | 1981-5794 |
language | English |
last_indexed | 2024-12-15T00:13:11Z |
publisher | Universidade Estadual Paulista Júlio de Mesquita Filho |
record_format | Article |
series | Alfa: Revista de Lingüística |
spelling | doaj.art-2da7d94214884d6689d3528e167ca0932022-12-21T22:42:31ZengUniversidade Estadual Paulista Júlio de Mesquita FilhoAlfa: Revista de Lingüística1981-5794631638010.1590/1981-5794-1904-3S1981-57942019000100063RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVREMaria José Bocorny FINATTOOto Araújo VALEÉric LAPORTERESUMO Relata-se um experimento de verificação da identificação de um universo de palavras do português popular escrito por duas versões de um dicionário computacional do português brasileiro (PB), DELAF PB 2004 e DELAF PB 2015. Esse dicionário computacional é gratuitamente acessível para ser utilizado em análises linguísticas do Português do Brasil e em outras pesquisas, o que justifica um estudo crítico. O universo vocabular provém do corpus PorPopular, composto por jornais populares, o Diário Gaúcho (DG) e o jornal baiano Massa ! (MA). Do DG, partiu-se de um conjunto de textos com 984.465 palavras ( tokens) , publicados em 2008, com ortografia desatualizada frente ao Acordo Ortográfico da Língua Portuguesa adotado em 2009. Do MA, examinou-se um universo com 215.776 palavras ( tokens) , em publicações de 2012, 2014 e 2015, com todo o material na nova ortografia. A verificação envolveu: a) gerar listas de palavras diferentes empregadas em DG e MA; b) comparar essas listas com as listas de entradas das duas versões do DELAF PB; c) avaliar a cobertura desse vocabulário; d) propor modos de inclusão de itens não cobertos. Os resultados do trabalho mostraram, no DG, uma média de 19% de palavras diferentes ( types) desconhecidas pelos DELAF PB 2004 e 2015. No MA, essa média ficou em 13%. A versão do dicionário repercutiu ligeiramente sobre o desempenho do reconhecimento de itens.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1981-57942019000100063&lng=en&tlng=enJornais popularesLéxicoVocabulárioDicionário computacionalCobertura lexicalReconhecimento de palavrasPortuguês brasileiro |
spellingShingle | Maria José Bocorny FINATTO Oto Araújo VALE Éric LAPORTE RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE Alfa: Revista de Lingüística Jornais populares Léxico Vocabulário Dicionário computacional Cobertura lexical Reconhecimento de palavras Português brasileiro |
title | RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE |
title_full | RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE |
title_fullStr | RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE |
title_full_unstemmed | RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE |
title_short | RECONHECIMENTO DO VOCABULÁRIO DE JORNAIS POPULARES BRASILEIROS POR UM DICIONÁRIO COMPUTACIONAL DE ACESSO LIVRE |
title_sort | reconhecimento do vocabulario de jornais populares brasileiros por um dicionario computacional de acesso livre |
topic | Jornais populares Léxico Vocabulário Dicionário computacional Cobertura lexical Reconhecimento de palavras Português brasileiro |
url | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1981-57942019000100063&lng=en&tlng=en |
work_keys_str_mv | AT mariajosebocornyfinatto reconhecimentodovocabulariodejornaispopularesbrasileirosporumdicionariocomputacionaldeacessolivre AT otoaraujovale reconhecimentodovocabulariodejornaispopularesbrasileirosporumdicionariocomputacionaldeacessolivre AT ericlaporte reconhecimentodovocabulariodejornaispopularesbrasileirosporumdicionariocomputacionaldeacessolivre |