Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica

Os diagnósticos da Doença de Alzheimer (DA) e do Comprometimento Cognitivo Leve (CCL) baseiam-se na análise das funções cognitivas do paciente pela administração de baterias de avaliação cognitiva e neuropsicológica. O emprego do reconto de narrativas é comum para auxiliar a identificação e quantifi...

Full description

Bibliographic Details
Main Authors:	Leandro dos Borges dos Santos, Sandra Maria Aluísio
Format:	Article
Language:	Catalan
Published:	Universidade do Minho & Universidade de Vigo 2020-01-01
Series:	Linguamática
Subjects:	testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
Online Access:	https://www.linguamatica.com/index.php/linguamatica/article/view/304

_version_	1828765097054437376
author	Leandro dos Borges dos Santos Sandra Maria Aluísio
author_facet	Leandro dos Borges dos Santos Sandra Maria Aluísio
author_sort	Leandro dos Borges dos Santos
collection	DOAJ
description	Os diagnósticos da Doença de Alzheimer (DA) e do Comprometimento Cognitivo Leve (CCL) baseiam-se na análise das funções cognitivas do paciente pela administração de baterias de avaliação cognitiva e neuropsicológica. O emprego do reconto de narrativas é comum para auxiliar a identificação e quantificação do grau de demência: é atribuído um ponto para cada unidade recordada, e o escore final representa a quantidade de unidades recordadas. Avaliamos duas tarefas da área clínica: a identificação automática de quais elementos de uma narrativa recontada foram recordados; e a classificação binária da narrativa produzida por um paciente, tendo as unidades identificadas como atributos, visando uma triagem automática dos pacientes com comprometimentos cognitivos. Utilizamos dois conjuntos de dados de reconto transcritos que possuem as sentenças divididas e anotadas manualmente com as unidades de informação e os disponibilizamos publicamente. São eles: a Bateria Arizona para Desordens de Comunicação e Demência (ABCD) com narrativas de pacientes com CCL e Controles Saudáveis e a Bateria de Avaliação da Linguagem no Envelhecimento (BALE), com narrativas de pacientes com DA e CCLs, e Controles Saudáveis. Avaliamos dois métodos baseados em similaridade semântica, chamados de STS e Chunking, e transformamos o problema multirrótulo de identificação de elementos de uma narrativa recontada em problemas de classificação binária, encontrando um ponto de corte para o valor de similaridade de cada unidade de informação. Dessa forma, conseguimos superar dois baselines para os dois conjuntos de dados na métrica SubsetAccuracy, que é a mais punitiva para o cenário multirrótulo. Na classificação binária nem todos os seis métodos de aprendizado de máquina avaliados tiveram melhor desempenho do que os baselines de identificação de unidades de informação. Para a ABCD, os melhores métodos foram Árvores de Decisão e KNN, e para a BALE, o SVM com kernel RBF.
first_indexed	2024-12-11T06:43:27Z
format	Article
id	doaj.art-519e40a5525b42b7b961213234093d21
institution	Directory Open Access Journal
issn	1647-0818
language	Catalan
last_indexed	2024-12-11T06:43:27Z
publishDate	2020-01-01
publisher	Universidade do Minho & Universidade de Vigo
record_format	Article
series	Linguamática
spelling	doaj.art-519e40a5525b42b7b961213234093d212022-12-22T01:17:10ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182020-01-0111210.21814/lm.11.2.304Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semânticaLeandro dos Borges dos Santos0Sandra Maria Aluísio1Universidade de São PauloUniversidade de São PauloOs diagnósticos da Doença de Alzheimer (DA) e do Comprometimento Cognitivo Leve (CCL) baseiam-se na análise das funções cognitivas do paciente pela administração de baterias de avaliação cognitiva e neuropsicológica. O emprego do reconto de narrativas é comum para auxiliar a identificação e quantificação do grau de demência: é atribuído um ponto para cada unidade recordada, e o escore final representa a quantidade de unidades recordadas. Avaliamos duas tarefas da área clínica: a identificação automática de quais elementos de uma narrativa recontada foram recordados; e a classificação binária da narrativa produzida por um paciente, tendo as unidades identificadas como atributos, visando uma triagem automática dos pacientes com comprometimentos cognitivos. Utilizamos dois conjuntos de dados de reconto transcritos que possuem as sentenças divididas e anotadas manualmente com as unidades de informação e os disponibilizamos publicamente. São eles: a Bateria Arizona para Desordens de Comunicação e Demência (ABCD) com narrativas de pacientes com CCL e Controles Saudáveis e a Bateria de Avaliação da Linguagem no Envelhecimento (BALE), com narrativas de pacientes com DA e CCLs, e Controles Saudáveis. Avaliamos dois métodos baseados em similaridade semântica, chamados de STS e Chunking, e transformamos o problema multirrótulo de identificação de elementos de uma narrativa recontada em problemas de classificação binária, encontrando um ponto de corte para o valor de similaridade de cada unidade de informação. Dessa forma, conseguimos superar dois baselines para os dois conjuntos de dados na métrica SubsetAccuracy, que é a mais punitiva para o cenário multirrótulo. Na classificação binária nem todos os seis métodos de aprendizado de máquina avaliados tiveram melhor desempenho do que os baselines de identificação de unidades de informação. Para a ABCD, os melhores métodos foram Árvores de Decisão e KNN, e para a BALE, o SVM com kernel RBF.https://www.linguamatica.com/index.php/linguamatica/article/view/304testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
spellingShingle	Leandro dos Borges dos Santos Sandra Maria Aluísio Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica Linguamática testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
title	Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_full	Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_fullStr	Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_full_unstemmed	Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_short	Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_sort	identificacao automatica de unidades de informacao em testes de reconto de narrativas usando metodos de similaridade semantica
topic	testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
url	https://www.linguamatica.com/index.php/linguamatica/article/view/304
work_keys_str_mv	AT leandrodosborgesdossantos identificacaoautomaticadeunidadesdeinformacaoemtestesderecontodenarrativasusandometodosdesimilaridadesemantica AT sandramariaaluisio identificacaoautomaticadeunidadesdeinformacaoemtestesderecontodenarrativasusandometodosdesimilaridadesemantica

Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica

Similar Items