Método de extracción de rasgos robusto para un sistema de diarización

Los Sistemas Automáticos de Reconocimiento de Locutores, son sistemas biométricos que permiten realizar la identificación y verificación de personas, empleando la voz como rasgo discriminatorio. Uno de los desafíos a superar durante el proceso de reconocimiento, ocurre cuando el flujo de audio a proces...

Full description

Bibliographic Details
Main Authors: Edward L. Campbell Hernández, Gabriel Hernández Sierra, José R. Calvo de Lara
Format: Article
Language:Spanish
Published: Universidad de Ciencias Informáticas 2018-09-01
Series:Revista Cubana de Ciencias Informáticas
Subjects:
Online Access:http://rcci.uci.cu/?journal=rcci&page=article&op=download&path%5B%5D=1763&path%5B%5D=648
_version_ 1811221506132279296
author Edward L. Campbell Hernández
Gabriel Hernández Sierra
José R. Calvo de Lara
author_facet Edward L. Campbell Hernández
Gabriel Hernández Sierra
José R. Calvo de Lara
author_sort Edward L. Campbell Hernández
collection DOAJ
description Los Sistemas Automáticos de Reconocimiento de Locutores, son sistemas biométricos que permiten realizar la identificación y verificación de personas, empleando la voz como rasgo discriminatorio. Uno de los desafíos a superar durante el proceso de reconocimiento, ocurre cuando el flujo de audio a procesar presenta varios locutores, ya que es necesario tener conocimiento de la ubicación temporal de los segmentos de audio relativos a cada locutor, para poder comparar directamente dichos segmentos con las muestras de locutores almacenadas en la base de datos de enrolamiento. Los sistemas de diarización permiten ubicar temporalmente los segmentos de audio relativos a cada locutor, dando solución, al problema mencionado en el reconocedor. En este artículo se propone el empleo de una técnica de extracción de rasgos robusta como subconjunto del sistema de diarización, denominada Respuesta sin Distorsión de Variación Mínima Perceptiva, la cual demostró mayor robustez ante ruido que la técnica dominante en el estado del arte, los Coeficientes Cepstrales en las Frecuencias de Mel. Experimentalmente se demostró como el rasgo propuesto presenta un menor nivel de varianza con respecto a los rasgos mel, entre tramas limpias y sucias, sometiendo el audio a una relación señal ruido de 6 dB y 8dB respectivamente.
first_indexed 2024-04-12T08:00:28Z
format Article
id doaj.art-f704c74ffa154ed487a71a00571e60e6
institution Directory Open Access Journal
issn 1994-1536
2227-1899
language Spanish
last_indexed 2024-04-12T08:00:28Z
publishDate 2018-09-01
publisher Universidad de Ciencias Informáticas
record_format Article
series Revista Cubana de Ciencias Informáticas
spelling doaj.art-f704c74ffa154ed487a71a00571e60e62022-12-22T03:41:21ZspaUniversidad de Ciencias InformáticasRevista Cubana de Ciencias Informáticas1994-15362227-18992018-09-01123140151Método de extracción de rasgos robusto para un sistema de diarizaciónEdward L. Campbell Hernández0Gabriel Hernández Sierra1José R. Calvo de Lara2Empresa DATYS, Calle 7a A # 21406 e/ 214 y 216, Playa, Ciudad Habana, CUBAEmpresa DATYS, Calle 7a A # 21406 e/ 214 y 216, Playa, Ciudad Habana, CUBAEmpresa DATYS, Calle 7a A # 21406 e/ 214 y 216, Playa, Ciudad Habana, CUBALos Sistemas Automáticos de Reconocimiento de Locutores, son sistemas biométricos que permiten realizar la identificación y verificación de personas, empleando la voz como rasgo discriminatorio. Uno de los desafíos a superar durante el proceso de reconocimiento, ocurre cuando el flujo de audio a procesar presenta varios locutores, ya que es necesario tener conocimiento de la ubicación temporal de los segmentos de audio relativos a cada locutor, para poder comparar directamente dichos segmentos con las muestras de locutores almacenadas en la base de datos de enrolamiento. Los sistemas de diarización permiten ubicar temporalmente los segmentos de audio relativos a cada locutor, dando solución, al problema mencionado en el reconocedor. En este artículo se propone el empleo de una técnica de extracción de rasgos robusta como subconjunto del sistema de diarización, denominada Respuesta sin Distorsión de Variación Mínima Perceptiva, la cual demostró mayor robustez ante ruido que la técnica dominante en el estado del arte, los Coeficientes Cepstrales en las Frecuencias de Mel. Experimentalmente se demostró como el rasgo propuesto presenta un menor nivel de varianza con respecto a los rasgos mel, entre tramas limpias y sucias, sometiendo el audio a una relación señal ruido de 6 dB y 8dB respectivamente.http://rcci.uci.cu/?journal=rcci&page=article&op=download&path%5B%5D=1763&path%5B%5D=648diarizaciónrasgo robustorespuesta sin distorsión de variación mínima perceptiva
spellingShingle Edward L. Campbell Hernández
Gabriel Hernández Sierra
José R. Calvo de Lara
Método de extracción de rasgos robusto para un sistema de diarización
Revista Cubana de Ciencias Informáticas
diarización
rasgo robusto
respuesta sin distorsión de variación mínima perceptiva
title Método de extracción de rasgos robusto para un sistema de diarización
title_full Método de extracción de rasgos robusto para un sistema de diarización
title_fullStr Método de extracción de rasgos robusto para un sistema de diarización
title_full_unstemmed Método de extracción de rasgos robusto para un sistema de diarización
title_short Método de extracción de rasgos robusto para un sistema de diarización
title_sort metodo de extraccion de rasgos robusto para un sistema de diarizacion
topic diarización
rasgo robusto
respuesta sin distorsión de variación mínima perceptiva
url http://rcci.uci.cu/?journal=rcci&page=article&op=download&path%5B%5D=1763&path%5B%5D=648
work_keys_str_mv AT edwardlcampbellhernandez metododeextraccionderasgosrobustoparaunsistemadediarizacion
AT gabrielhernandezsierra metododeextraccionderasgosrobustoparaunsistemadediarizacion
AT josercalvodelara metododeextraccionderasgosrobustoparaunsistemadediarizacion