Classificação de disfonias por meio da análise de medidas não lineares e de quantificação de recorrência

<p>Nos últimos anos, técnicas de processamento digital de sinais de voz vêm sendo empregadas como ferramentas auxiliares na avaliação de desvios vocais, trazendo maior comodidade ao paciente, baixo custo e caráter objetivo, comparado às técnicas tradicionalmente empregadas, como a análise perc...

Full description

Bibliographic Details
Main Authors: Giulliana Karla Lacerda Pereira de Queiroz, Silvana Luciene do Nascimento Cunha Costa, Suzete Élida Nóbrega Correia, Vinícius Jefferson Dias Vieira, Leonardo Wanderley Lopes
Format: Article
Language:English
Published: Instituto Federal de Educação, Ciência e Tecnologia da Paraíba 2018-02-01
Series:Revista Principia
Subjects:
Online Access:https://periodicos.ifpb.edu.br/index.php/principia/article/view/1564
Description
Summary:<p>Nos últimos anos, técnicas de processamento digital de sinais de voz vêm sendo empregadas como ferramentas auxiliares na avaliação de desvios vocais, trazendo maior comodidade ao paciente, baixo custo e caráter objetivo, comparado às técnicas tradicionalmente empregadas, como a análise perceptivo-auditiva. A avaliação da qualidade vocal, por análise acústica de sinais de voz, se constitui cada vez mais em prática clínica para detecção de distúrbios vocais que, em alguns casos, podem ser ocasionados por lesões laríngeas ou abuso vocal. Nesta pesquisa, foram empregadas algumas medidas não lineares tradicionais, combinadas com medidas de quantificação de recorrência, para a análise discriminativa dos desvios vocais rugosidade, soprosidade e tensão. As características da análise dinâmica não linear, abordadas para o processo de classificação, foram o Passo de Reconstrução (<em>t</em>), o Primeiro Mínimo da Função de Informação Mútua (<em>PM</em>) e a Dimensão de correlação (<em>D<sub>2</sub></em>). As medidas de quantificação empregadas foram: Determinismo (<em>Det</em>), Entropia de Shannon (<em>Entr</em>), Comprimento médio das linhas diagonais (<em>Lmed</em>), Comprimento máximo das linhas verticais (<em>Vmax</em>) e Transitividade (<em>Trans</em>). Por meio de testes estatísticos, foi avaliado o potencial de cada característica em discriminar os tipos de sinais de voz considerados. No processo de classificação, foi utilizada a rede neural MLP (<em>Multilayer Perceptron</em>), com algoritmo de aprendizado supervisionado Scheduling Conjugate Graded (SCG). Obteve-se uma acurácia média de 90% na discriminação entre vozes saudáveis e desviadas. Na classificação entre vozes saudáveis e tensas, obteve-se uma acurácia média de 76%, com as medidas combinadas <em>Trans</em>, <em>t</em>, <em>Vmax, Lmed, Det</em> e <em>D<sub>2</sub></em>. Na detecção do desvio rugosidade, obteve-se uma acurácia média de 89% com as medidas <em>Lmed, Entr, Trans</em> e <em>D2</em> e, na distinção entre as vozes saudáveis e soprosas, obteve-se 91,17% com apenas duas medidas combinadas <em>Trans </em>e<em> </em><em>t</em>, demonstrando o caráter promissor da técnica empregada.  <strong></strong></p>
ISSN:1517-0306
2447-9187