Método de extracción de rasgos robusto para un sistema de diarización
Los Sistemas Automáticos de Reconocimiento de Locutores, son sistemas biométricos que permiten realizar la identificación y verificación de personas, empleando la voz como rasgo discriminatorio. Uno de los desafíos a superar durante el proceso de reconocimiento, ocurre cuando el flujo de audio a proces...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Spanish |
Published: |
Universidad de Ciencias Informáticas
2018-09-01
|
Series: | Revista Cubana de Ciencias Informáticas |
Subjects: | |
Online Access: | http://rcci.uci.cu/?journal=rcci&page=article&op=download&path%5B%5D=1763&path%5B%5D=648 |
_version_ | 1811221506132279296 |
---|---|
author | Edward L. Campbell Hernández Gabriel Hernández Sierra José R. Calvo de Lara |
author_facet | Edward L. Campbell Hernández Gabriel Hernández Sierra José R. Calvo de Lara |
author_sort | Edward L. Campbell Hernández |
collection | DOAJ |
description | Los Sistemas Automáticos de Reconocimiento de Locutores, son sistemas biométricos que permiten realizar la identificación y verificación de personas, empleando la voz como rasgo discriminatorio. Uno de los desafíos a superar durante el proceso de reconocimiento, ocurre cuando el flujo de audio a procesar presenta varios locutores, ya que es necesario tener conocimiento de la ubicación temporal de los segmentos de audio relativos a cada locutor, para poder comparar directamente dichos segmentos con las muestras de locutores almacenadas en la base de datos de enrolamiento. Los sistemas de diarización permiten ubicar temporalmente los segmentos de audio relativos a cada locutor, dando solución, al problema mencionado en el reconocedor. En este artículo se propone el empleo de una técnica de extracción de rasgos robusta como subconjunto del sistema de diarización, denominada Respuesta sin Distorsión de Variación Mínima Perceptiva, la cual demostró mayor robustez ante ruido que la técnica dominante en el estado del arte, los Coeficientes Cepstrales en las Frecuencias de Mel. Experimentalmente se demostró como el rasgo propuesto presenta un menor nivel de varianza con respecto a los rasgos mel, entre tramas limpias y sucias, sometiendo el audio a una relación señal ruido de 6 dB y 8dB respectivamente. |
first_indexed | 2024-04-12T08:00:28Z |
format | Article |
id | doaj.art-f704c74ffa154ed487a71a00571e60e6 |
institution | Directory Open Access Journal |
issn | 1994-1536 2227-1899 |
language | Spanish |
last_indexed | 2024-04-12T08:00:28Z |
publishDate | 2018-09-01 |
publisher | Universidad de Ciencias Informáticas |
record_format | Article |
series | Revista Cubana de Ciencias Informáticas |
spelling | doaj.art-f704c74ffa154ed487a71a00571e60e62022-12-22T03:41:21ZspaUniversidad de Ciencias InformáticasRevista Cubana de Ciencias Informáticas1994-15362227-18992018-09-01123140151Método de extracción de rasgos robusto para un sistema de diarizaciónEdward L. Campbell Hernández0Gabriel Hernández Sierra1José R. Calvo de Lara2Empresa DATYS, Calle 7a A # 21406 e/ 214 y 216, Playa, Ciudad Habana, CUBAEmpresa DATYS, Calle 7a A # 21406 e/ 214 y 216, Playa, Ciudad Habana, CUBAEmpresa DATYS, Calle 7a A # 21406 e/ 214 y 216, Playa, Ciudad Habana, CUBALos Sistemas Automáticos de Reconocimiento de Locutores, son sistemas biométricos que permiten realizar la identificación y verificación de personas, empleando la voz como rasgo discriminatorio. Uno de los desafíos a superar durante el proceso de reconocimiento, ocurre cuando el flujo de audio a procesar presenta varios locutores, ya que es necesario tener conocimiento de la ubicación temporal de los segmentos de audio relativos a cada locutor, para poder comparar directamente dichos segmentos con las muestras de locutores almacenadas en la base de datos de enrolamiento. Los sistemas de diarización permiten ubicar temporalmente los segmentos de audio relativos a cada locutor, dando solución, al problema mencionado en el reconocedor. En este artículo se propone el empleo de una técnica de extracción de rasgos robusta como subconjunto del sistema de diarización, denominada Respuesta sin Distorsión de Variación Mínima Perceptiva, la cual demostró mayor robustez ante ruido que la técnica dominante en el estado del arte, los Coeficientes Cepstrales en las Frecuencias de Mel. Experimentalmente se demostró como el rasgo propuesto presenta un menor nivel de varianza con respecto a los rasgos mel, entre tramas limpias y sucias, sometiendo el audio a una relación señal ruido de 6 dB y 8dB respectivamente.http://rcci.uci.cu/?journal=rcci&page=article&op=download&path%5B%5D=1763&path%5B%5D=648diarizaciónrasgo robustorespuesta sin distorsión de variación mínima perceptiva |
spellingShingle | Edward L. Campbell Hernández Gabriel Hernández Sierra José R. Calvo de Lara Método de extracción de rasgos robusto para un sistema de diarización Revista Cubana de Ciencias Informáticas diarización rasgo robusto respuesta sin distorsión de variación mínima perceptiva |
title | Método de extracción de rasgos robusto para un sistema de diarización |
title_full | Método de extracción de rasgos robusto para un sistema de diarización |
title_fullStr | Método de extracción de rasgos robusto para un sistema de diarización |
title_full_unstemmed | Método de extracción de rasgos robusto para un sistema de diarización |
title_short | Método de extracción de rasgos robusto para un sistema de diarización |
title_sort | metodo de extraccion de rasgos robusto para un sistema de diarizacion |
topic | diarización rasgo robusto respuesta sin distorsión de variación mínima perceptiva |
url | http://rcci.uci.cu/?journal=rcci&page=article&op=download&path%5B%5D=1763&path%5B%5D=648 |
work_keys_str_mv | AT edwardlcampbellhernandez metododeextraccionderasgosrobustoparaunsistemadediarizacion AT gabrielhernandezsierra metododeextraccionderasgosrobustoparaunsistemadediarizacion AT josercalvodelara metododeextraccionderasgosrobustoparaunsistemadediarizacion |