An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study

Una categorización automática de los hablantes de acuerdo con su sexo mejora el rendimiento de un detector automático de patologías de voz. Esto se fundamenta en hallazgos que demuestran diferencias perceptuales, acústicas y anatómicas en voces masculinas y femeninas. En particular, este trabajo per...

Full description

Bibliographic Details
Main Authors: Jorge Andrés Gómez-García, Laureano Moro-Velázquez, Juan Ignacio Godino-Llorente, César Germán Castellanos-Domínguez
Format: Article
Language:English
Published: Universidad de Antioquia 2016-01-01
Series:Revista Facultad de Ingeniería Universidad de Antioquia
Subjects:
Online Access:http://www.redalyc.org/articulo.oa?id=43045911006
_version_ 1797716868222418944
author Jorge Andrés Gómez-García
Laureano Moro-Velázquez
Juan Ignacio Godino-Llorente
César Germán Castellanos-Domínguez
author_facet Jorge Andrés Gómez-García
Laureano Moro-Velázquez
Juan Ignacio Godino-Llorente
César Germán Castellanos-Domínguez
author_sort Jorge Andrés Gómez-García
collection DOAJ
description Una categorización automática de los hablantes de acuerdo con su sexo mejora el rendimiento de un detector automático de patologías de voz. Esto se fundamenta en hallazgos que demuestran diferencias perceptuales, acústicas y anatómicas en voces masculinas y femeninas. En particular, este trabajo persigue dos objetivos: 1) diseñar un sistema que discrimine automáticamente el sexo de hablantes utilizando habla normofónica y patológica, 2) estudiar la influencia que este detector de sexo tiene sobre el acierto de un posterior detector de patologías de voz. La parametrización del detector automático de sexo se basa en MFCC aplicados sobre señales de voz; y MFCC aplicados a formas de onda glotal junto a parámetros que modelan el tracto vocal. Las formas de onda glotal se extraen de la voz a través de un filtrado inverso iterativo en celosía. En cuanto al detector de patologías, una parametrización MFCC se aplica a señales de voz. La clasificación, tanto en los detectores de sexo como de patología, se lleva a cabo con técnicas del estado del arte basadas en modelos de base universal. Experimentos son realizados sobre la base de datos Saarbrücken empleando la fonación sostenida de la vocal /a/. Los resultados indican que el sexo del hablante puede ser discriminado automáticamente utilizando habla normofónica y patológica, obteniendo una precisión de hasta un 95%. Por otra parte, al incluir información a priori sobre el sexo del hablante se produce una mejora de alrededor del 2% de rendimiento absoluto en EER, en tareas de detección de patología.
first_indexed 2024-03-12T08:27:47Z
format Article
id doaj.art-6cafb07f45e64555874afb005b6a70db
institution Directory Open Access Journal
issn 0120-6230
2422-2844
language English
last_indexed 2024-03-12T08:27:47Z
publishDate 2016-01-01
publisher Universidad de Antioquia
record_format Article
series Revista Facultad de Ingeniería Universidad de Antioquia
spelling doaj.art-6cafb07f45e64555874afb005b6a70db2023-09-02T17:59:22ZengUniversidad de AntioquiaRevista Facultad de Ingeniería Universidad de Antioquia0120-62302422-28442016-01-01795062An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative studyJorge Andrés Gómez-GarcíaLaureano Moro-VelázquezJuan Ignacio Godino-LlorenteCésar Germán Castellanos-DomínguezUna categorización automática de los hablantes de acuerdo con su sexo mejora el rendimiento de un detector automático de patologías de voz. Esto se fundamenta en hallazgos que demuestran diferencias perceptuales, acústicas y anatómicas en voces masculinas y femeninas. En particular, este trabajo persigue dos objetivos: 1) diseñar un sistema que discrimine automáticamente el sexo de hablantes utilizando habla normofónica y patológica, 2) estudiar la influencia que este detector de sexo tiene sobre el acierto de un posterior detector de patologías de voz. La parametrización del detector automático de sexo se basa en MFCC aplicados sobre señales de voz; y MFCC aplicados a formas de onda glotal junto a parámetros que modelan el tracto vocal. Las formas de onda glotal se extraen de la voz a través de un filtrado inverso iterativo en celosía. En cuanto al detector de patologías, una parametrización MFCC se aplica a señales de voz. La clasificación, tanto en los detectores de sexo como de patología, se lleva a cabo con técnicas del estado del arte basadas en modelos de base universal. Experimentos son realizados sobre la base de datos Saarbrücken empleando la fonación sostenida de la vocal /a/. Los resultados indican que el sexo del hablante puede ser discriminado automáticamente utilizando habla normofónica y patológica, obteniendo una precisión de hasta un 95%. Por otra parte, al incluir información a priori sobre el sexo del hablante se produce una mejora de alrededor del 2% de rendimiento absoluto en EER, en tareas de detección de patología.http://www.redalyc.org/articulo.oa?id=43045911006detección de la patología de vozfiltrado inversogmmubm
spellingShingle Jorge Andrés Gómez-García
Laureano Moro-Velázquez
Juan Ignacio Godino-Llorente
César Germán Castellanos-Domínguez
An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study
Revista Facultad de Ingeniería Universidad de Antioquia
detección de la patología de voz
filtrado inverso
gmm
ubm
title An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study
title_full An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study
title_fullStr An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study
title_full_unstemmed An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study
title_short An insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies: A comparative study
title_sort insight to the automatic categorization of speakers according to sex and its application to the detection of voice pathologies a comparative study
topic detección de la patología de voz
filtrado inverso
gmm
ubm
url http://www.redalyc.org/articulo.oa?id=43045911006
work_keys_str_mv AT jorgeandresgomezgarcia aninsighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT laureanomorovelazquez aninsighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT juanignaciogodinollorente aninsighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT cesargermancastellanosdominguez aninsighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT jorgeandresgomezgarcia insighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT laureanomorovelazquez insighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT juanignaciogodinollorente insighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy
AT cesargermancastellanosdominguez insighttotheautomaticcategorizationofspeakersaccordingtosexanditsapplicationtothedetectionofvoicepathologiesacomparativestudy