Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro

Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma r...

Full description

Bibliographic Details
Main Author:	Pablo Faria
Format:	Article
Language:	English
Published:	Centro de Estudos Humanísticos da Universidade do Minho 2019-12-01
Series:	Diacrítica
Subjects:	Aquisição da linguagem Aprendizagem de categorias Análise distribucional Modelagem Cognitiva
Online Access:	https://revistas.uminho.pt/index.php/diacritica/article/view/5063

_version_	1797328382927568896
author	Pablo Faria
author_facet	Pablo Faria
author_sort	Pablo Faria
collection	DOAJ
description	Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). Esta última parece produzir melhor performance. Neste artigo, focamos numa análise quantitativa dos nossos resultados.
first_indexed	2024-03-08T06:51:03Z
format	Article
id	doaj.art-6608457f310c488a90b6a08efb14e6f5
institution	Directory Open Access Journal
issn	0870-8967 2183-9174
language	English
last_indexed	2024-03-08T06:51:03Z
publishDate	2019-12-01
publisher	Centro de Estudos Humanísticos da Universidade do Minho
record_format	Article
series	Diacrítica
spelling	doaj.art-6608457f310c488a90b6a08efb14e6f52024-02-03T06:51:15ZengCentro de Estudos Humanísticos da Universidade do MinhoDiacrítica0870-89672183-91742019-12-01332Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português BrasileiroPablo Faria Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). Esta última parece produzir melhor performance. Neste artigo, focamos numa análise quantitativa dos nossos resultados. https://revistas.uminho.pt/index.php/diacritica/article/view/5063Aquisição da linguagemAprendizagem de categoriasAnálise distribucionalModelagem Cognitiva
spellingShingle	Pablo Faria Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro Diacrítica Aquisição da linguagem Aprendizagem de categorias Análise distribucional Modelagem Cognitiva
title	Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_full	Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_fullStr	Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_full_unstemmed	Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_short	Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
title_sort	aprendizagem de categorias de palavras por analise distribucional resultados adicionais para portugues brasileiro
topic	Aquisição da linguagem Aprendizagem de categorias Análise distribucional Modelagem Cognitiva
url	https://revistas.uminho.pt/index.php/diacritica/article/view/5063
work_keys_str_mv	AT pablofaria aprendizagemdecategoriasdepalavrasporanalisedistribucionalresultadosadicionaisparaportuguesbrasileiro

Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro

Similar Items