Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro
Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma r...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Centro de Estudos Humanísticos da Universidade do Minho
2019-12-01
|
Series: | Diacrítica |
Subjects: | |
Online Access: | https://revistas.uminho.pt/index.php/diacritica/article/view/5063 |
_version_ | 1797328382927568896 |
---|---|
author | Pablo Faria |
author_facet | Pablo Faria |
author_sort | Pablo Faria |
collection | DOAJ |
description |
Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). Esta última parece produzir melhor performance. Neste artigo, focamos numa análise quantitativa dos nossos resultados.
|
first_indexed | 2024-03-08T06:51:03Z |
format | Article |
id | doaj.art-6608457f310c488a90b6a08efb14e6f5 |
institution | Directory Open Access Journal |
issn | 0870-8967 2183-9174 |
language | English |
last_indexed | 2024-03-08T06:51:03Z |
publishDate | 2019-12-01 |
publisher | Centro de Estudos Humanísticos da Universidade do Minho |
record_format | Article |
series | Diacrítica |
spelling | doaj.art-6608457f310c488a90b6a08efb14e6f52024-02-03T06:51:15ZengCentro de Estudos Humanísticos da Universidade do MinhoDiacrítica0870-89672183-91742019-12-01332Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português BrasileiroPablo Faria Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). Esta última parece produzir melhor performance. Neste artigo, focamos numa análise quantitativa dos nossos resultados. https://revistas.uminho.pt/index.php/diacritica/article/view/5063Aquisição da linguagemAprendizagem de categoriasAnálise distribucionalModelagem Cognitiva |
spellingShingle | Pablo Faria Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro Diacrítica Aquisição da linguagem Aprendizagem de categorias Análise distribucional Modelagem Cognitiva |
title | Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro |
title_full | Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro |
title_fullStr | Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro |
title_full_unstemmed | Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro |
title_short | Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro |
title_sort | aprendizagem de categorias de palavras por analise distribucional resultados adicionais para portugues brasileiro |
topic | Aquisição da linguagem Aprendizagem de categorias Análise distribucional Modelagem Cognitiva |
url | https://revistas.uminho.pt/index.php/diacritica/article/view/5063 |
work_keys_str_mv | AT pablofaria aprendizagemdecategoriasdepalavrasporanalisedistribucionalresultadosadicionaisparaportuguesbrasileiro |