Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica

Os diagnósticos da Doença de Alzheimer (DA) e do Comprometimento Cognitivo Leve (CCL) baseiam-se na análise das funções cognitivas do paciente pela administração de baterias de avaliação cognitiva e neuropsicológica. O emprego do reconto de narrativas é comum para auxiliar a identificação e quantifi...

Full description

Bibliographic Details
Main Authors: Leandro dos Borges dos Santos, Sandra Maria Aluísio
Format: Article
Language:Catalan
Published: Universidade do Minho & Universidade de Vigo 2020-01-01
Series:Linguamática
Subjects:
Online Access:https://www.linguamatica.com/index.php/linguamatica/article/view/304
_version_ 1828765097054437376
author Leandro dos Borges dos Santos
Sandra Maria Aluísio
author_facet Leandro dos Borges dos Santos
Sandra Maria Aluísio
author_sort Leandro dos Borges dos Santos
collection DOAJ
description Os diagnósticos da Doença de Alzheimer (DA) e do Comprometimento Cognitivo Leve (CCL) baseiam-se na análise das funções cognitivas do paciente pela administração de baterias de avaliação cognitiva e neuropsicológica. O emprego do reconto de narrativas é comum para auxiliar a identificação e quantificação do grau de demência: é atribuído um ponto para cada unidade recordada, e o escore final representa a quantidade de unidades recordadas. Avaliamos duas tarefas da área clínica: a identificação automática de quais elementos de uma narrativa recontada foram recordados; e a classificação binária da narrativa produzida por um paciente, tendo as unidades identificadas como atributos, visando uma triagem automática dos pacientes com comprometimentos cognitivos. Utilizamos dois conjuntos de dados de reconto transcritos que possuem as sentenças divididas e anotadas manualmente com as unidades de informação e os disponibilizamos publicamente. São eles: a Bateria Arizona para Desordens de Comunicação e Demência (ABCD) com narrativas de pacientes com CCL e Controles Saudáveis e a Bateria de Avaliação da Linguagem no Envelhecimento (BALE), com narrativas de pacientes com DA e CCLs, e Controles Saudáveis. Avaliamos dois métodos baseados em similaridade semântica, chamados de STS e Chunking, e transformamos o problema multirrótulo de identificação de elementos de uma narrativa recontada em problemas de classificação binária, encontrando um ponto de corte para o valor de similaridade de cada unidade de informação. Dessa forma, conseguimos superar dois baselines para os dois conjuntos de dados na métrica SubsetAccuracy, que é a mais punitiva para o cenário multirrótulo. Na classificação binária nem todos os seis métodos de aprendizado de máquina avaliados tiveram melhor desempenho do que os baselines de identificação de unidades de informação. Para a ABCD, os melhores métodos foram Árvores de Decisão e KNN, e para a BALE, o SVM com kernel RBF.
first_indexed 2024-12-11T06:43:27Z
format Article
id doaj.art-519e40a5525b42b7b961213234093d21
institution Directory Open Access Journal
issn 1647-0818
language Catalan
last_indexed 2024-12-11T06:43:27Z
publishDate 2020-01-01
publisher Universidade do Minho & Universidade de Vigo
record_format Article
series Linguamática
spelling doaj.art-519e40a5525b42b7b961213234093d212022-12-22T01:17:10ZcatUniversidade do Minho & Universidade de VigoLinguamática1647-08182020-01-0111210.21814/lm.11.2.304Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semânticaLeandro dos Borges dos Santos0Sandra Maria Aluísio1Universidade de São PauloUniversidade de São PauloOs diagnósticos da Doença de Alzheimer (DA) e do Comprometimento Cognitivo Leve (CCL) baseiam-se na análise das funções cognitivas do paciente pela administração de baterias de avaliação cognitiva e neuropsicológica. O emprego do reconto de narrativas é comum para auxiliar a identificação e quantificação do grau de demência: é atribuído um ponto para cada unidade recordada, e o escore final representa a quantidade de unidades recordadas. Avaliamos duas tarefas da área clínica: a identificação automática de quais elementos de uma narrativa recontada foram recordados; e a classificação binária da narrativa produzida por um paciente, tendo as unidades identificadas como atributos, visando uma triagem automática dos pacientes com comprometimentos cognitivos. Utilizamos dois conjuntos de dados de reconto transcritos que possuem as sentenças divididas e anotadas manualmente com as unidades de informação e os disponibilizamos publicamente. São eles: a Bateria Arizona para Desordens de Comunicação e Demência (ABCD) com narrativas de pacientes com CCL e Controles Saudáveis e a Bateria de Avaliação da Linguagem no Envelhecimento (BALE), com narrativas de pacientes com DA e CCLs, e Controles Saudáveis. Avaliamos dois métodos baseados em similaridade semântica, chamados de STS e Chunking, e transformamos o problema multirrótulo de identificação de elementos de uma narrativa recontada em problemas de classificação binária, encontrando um ponto de corte para o valor de similaridade de cada unidade de informação. Dessa forma, conseguimos superar dois baselines para os dois conjuntos de dados na métrica SubsetAccuracy, que é a mais punitiva para o cenário multirrótulo. Na classificação binária nem todos os seis métodos de aprendizado de máquina avaliados tiveram melhor desempenho do que os baselines de identificação de unidades de informação. Para a ABCD, os melhores métodos foram Árvores de Decisão e KNN, e para a BALE, o SVM com kernel RBF.https://www.linguamatica.com/index.php/linguamatica/article/view/304testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
spellingShingle Leandro dos Borges dos Santos
Sandra Maria Aluísio
Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
Linguamática
testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
title Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_full Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_fullStr Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_full_unstemmed Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_short Identificação automática de unidades de informação em testes de reconto de narrativas usando métodos de similaridade semântica
title_sort identificacao automatica de unidades de informacao em testes de reconto de narrativas usando metodos de similaridade semantica
topic testes neuropsicológicos, reconto de narrativas, métodos de similaridade semântica
url https://www.linguamatica.com/index.php/linguamatica/article/view/304
work_keys_str_mv AT leandrodosborgesdossantos identificacaoautomaticadeunidadesdeinformacaoemtestesderecontodenarrativasusandometodosdesimilaridadesemantica
AT sandramariaaluisio identificacaoautomaticadeunidadesdeinformacaoemtestesderecontodenarrativasusandometodosdesimilaridadesemantica