Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro

Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma r...

Full description

Bibliographic Details
Main Author: Pablo Faria
Format: Article
Language:English
Published: Centro de Estudos Humanísticos da Universidade do Minho 2019-12-01
Series:Diacrítica
Subjects:
Online Access:https://revistas.uminho.pt/index.php/diacritica/article/view/5063
_version_ 1797328382927568896
author Pablo Faria
author_facet Pablo Faria
author_sort Pablo Faria
collection DOAJ
description Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). Esta última parece produzir melhor performance. Neste artigo, focamos numa análise quantitativa dos nossos resultados.
first_indexed 2024-03-08T06:51:03Z
format Article
id doaj.art-6608457f310c488a90b6a08efb14e6f5
institution Directory Open Access Journal
issn 0870-8967
2183-9174
language English
last_indexed 2024-03-08T06:51:03Z
publishDate 2019-12-01
publisher Centro de Estudos Humanísticos da Universidade do Minho
record_format Article
series Diacrítica
spelling doaj.art-6608457f310c488a90b6a08efb14e6f52024-02-03T06:51:15ZengCentro de Estudos Humanísticos da Universidade do MinhoDiacrítica0870-89672183-91742019-12-01332Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português BrasileiroPablo Faria Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). Esta última parece produzir melhor performance. Neste artigo, focamos numa análise quantitativa dos nossos resultados. https://revistas.uminho.pt/index.php/diacritica/article/view/5063Aquisição da linguagemAprendizagem de categoriasAnálise distribucionalModelagem Cognitiva
spellingShingle Pablo Faria
Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
Diacrítica
Aquisição da linguagem
Aprendizagem de categorias
Análise distribucional
Modelagem Cognitiva
title Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_full Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_fullStr Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_full_unstemmed Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_short Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_sort aprendizagem de categorias de palavras por analise distribucional resultados adicionais para portugues brasileiro
topic Aquisição da linguagem
Aprendizagem de categorias
Análise distribucional
Modelagem Cognitiva
url https://revistas.uminho.pt/index.php/diacritica/article/view/5063
work_keys_str_mv AT pablofaria aprendizagemdecategoriasdepalavrasporanalisedistribucionalresultadosadicionaisparaportuguesbrasileiro