Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla

Contexto: El reconocimiento automático del habla requiere el desarrollo de modelos de lenguaje y modelos acústicos para los diferentes dialectos que existen. El objeto de esta investigación es el entrenamiento de un modelo acústico, un modelo de lenguaje estadístico y un modelo de lenguaje gramatica...

Full description

Bibliographic Details
Main Authors: Juan David Celis Nuñez, Rodrigo Andres Llanos Castro, Byron Medina Delgado, Sergio Basilio Sepúlveda Mora, Sergio Alexander Castro Casadiego
Format: Article
Language:Spanish
Published: Universidad Distrital Francisco José de Caldas 2017-09-01
Series:Ingeniería
Subjects:
Online Access:https://revistas.udistrital.edu.co/ojs/index.php/reving/article/view/11616
_version_ 1818145269108178944
author Juan David Celis Nuñez
Rodrigo Andres Llanos Castro
Byron Medina Delgado
Sergio Basilio Sepúlveda Mora
Sergio Alexander Castro Casadiego
author_facet Juan David Celis Nuñez
Rodrigo Andres Llanos Castro
Byron Medina Delgado
Sergio Basilio Sepúlveda Mora
Sergio Alexander Castro Casadiego
author_sort Juan David Celis Nuñez
collection DOAJ
description Contexto: El reconocimiento automático del habla requiere el desarrollo de modelos de lenguaje y modelos acústicos para los diferentes dialectos que existen. El objeto de esta investigación es el entrenamiento de un modelo acústico, un modelo de lenguaje estadístico y un modelo de lenguaje gramatical para el idioma español, específicamente para el dialecto de la ciudad de San José de Cúcuta, Colombia, que pueda ser utilizado en un sistema de control por comandos. Lo anterior motivado en las deficiencias que presentan los modelos existentes para el idioma español, para el reconocimiento de la frecuencia fundamental y contenido espectral, el acento, la pronunciación, el tono o simplemente al modelo de lenguaje de la variante dialéctica de esta región. Método: Este proyecto utiliza el sistema embebido Raspberry Pi B+ con el sistema operativo Raspbian que es una distribución de Linux, y los softwares de código abierto CMU-Cambridge Statistical Language Modeling toolkit de la Universidad de Cambridge y CMU Sphinx de la Universidad Carnegie Mellon; los cuales se basan en los modelos ocultos de Markov para el cálculo de los parámetros de voz. Además, se utilizaron 1913 audios grabados por locutores de la ciudad de San José de Cúcuta y el departamento de Norte de Santander para el entrenamiento y las pruebas del sistema de reconocimiento automático del habla. Resultados: Se obtuvo un modelo de lenguaje que consiste de dos archivos, uno de modelo de lenguaje estadístico (. lm), y uno de modelo gramatical (. jsgf). Con relación a la parte acústica se entrenaron dos modelos, uno de ellos con una versión mejorada que obtuvo una tasa de acierto en el reconocimiento de comandos del 100% en los datos de entrenamiento y de 83% en las pruebas de audio. Por último, se elaboró un manual para la creación de los modelos acústicos y de lenguaje con el software CMU Sphinx.   Conclusiones: El número de participantes en el proceso de entrenamiento de los modelos acústicos y de lenguaje influye significativamente en la calidad del procesamiento de voz del reconocedor. Para obtener una mejor respuesta del sistema de Reconocimiento Automático del Habla es importante usar un diccionario largo para la etapa de entrenamiento y un diccionario corto con las palabras de comando para la implementación del sistema. Teniendo en cuenta que en las pruebas de reconocimiento se obtuvo una tasa de éxito mayor al 80% es posible usar los modelos creados en el desarrollo de un sistema de Reconocimiento Automático del Habla para una aplicación orientada a la asistencia de personas con discapacidad visual o incapacidad de movimiento.
first_indexed 2024-12-11T12:00:46Z
format Article
id doaj.art-7306de2f32fc4889873f95b7e54b9ffa
institution Directory Open Access Journal
issn 0121-750X
2344-8393
language Spanish
last_indexed 2024-12-11T12:00:46Z
publishDate 2017-09-01
publisher Universidad Distrital Francisco José de Caldas
record_format Article
series Ingeniería
spelling doaj.art-7306de2f32fc4889873f95b7e54b9ffa2022-12-22T01:08:05ZspaUniversidad Distrital Francisco José de CaldasIngeniería0121-750X2344-83932017-09-0122336237610.14483/23448393.1161611616Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del HablaJuan David Celis Nuñez0Rodrigo Andres Llanos Castro1Byron Medina Delgado2Sergio Basilio Sepúlveda Mora3Sergio Alexander Castro Casadiego4Universidad Francisco de Paula SantanderUniversidad Francisco de Paula SantanderUniversidad Francisco de Paula SantanderUniversidad Francisco de Paula SantanderUniversidad Francisco de Paula SantanderContexto: El reconocimiento automático del habla requiere el desarrollo de modelos de lenguaje y modelos acústicos para los diferentes dialectos que existen. El objeto de esta investigación es el entrenamiento de un modelo acústico, un modelo de lenguaje estadístico y un modelo de lenguaje gramatical para el idioma español, específicamente para el dialecto de la ciudad de San José de Cúcuta, Colombia, que pueda ser utilizado en un sistema de control por comandos. Lo anterior motivado en las deficiencias que presentan los modelos existentes para el idioma español, para el reconocimiento de la frecuencia fundamental y contenido espectral, el acento, la pronunciación, el tono o simplemente al modelo de lenguaje de la variante dialéctica de esta región. Método: Este proyecto utiliza el sistema embebido Raspberry Pi B+ con el sistema operativo Raspbian que es una distribución de Linux, y los softwares de código abierto CMU-Cambridge Statistical Language Modeling toolkit de la Universidad de Cambridge y CMU Sphinx de la Universidad Carnegie Mellon; los cuales se basan en los modelos ocultos de Markov para el cálculo de los parámetros de voz. Además, se utilizaron 1913 audios grabados por locutores de la ciudad de San José de Cúcuta y el departamento de Norte de Santander para el entrenamiento y las pruebas del sistema de reconocimiento automático del habla. Resultados: Se obtuvo un modelo de lenguaje que consiste de dos archivos, uno de modelo de lenguaje estadístico (. lm), y uno de modelo gramatical (. jsgf). Con relación a la parte acústica se entrenaron dos modelos, uno de ellos con una versión mejorada que obtuvo una tasa de acierto en el reconocimiento de comandos del 100% en los datos de entrenamiento y de 83% en las pruebas de audio. Por último, se elaboró un manual para la creación de los modelos acústicos y de lenguaje con el software CMU Sphinx.   Conclusiones: El número de participantes en el proceso de entrenamiento de los modelos acústicos y de lenguaje influye significativamente en la calidad del procesamiento de voz del reconocedor. Para obtener una mejor respuesta del sistema de Reconocimiento Automático del Habla es importante usar un diccionario largo para la etapa de entrenamiento y un diccionario corto con las palabras de comando para la implementación del sistema. Teniendo en cuenta que en las pruebas de reconocimiento se obtuvo una tasa de éxito mayor al 80% es posible usar los modelos creados en el desarrollo de un sistema de Reconocimiento Automático del Habla para una aplicación orientada a la asistencia de personas con discapacidad visual o incapacidad de movimiento.https://revistas.udistrital.edu.co/ojs/index.php/reving/article/view/11616reconocimiento del hablamodelos acústicosmodelos de lenguajesCMU SphinxRaspberry Pi.
spellingShingle Juan David Celis Nuñez
Rodrigo Andres Llanos Castro
Byron Medina Delgado
Sergio Basilio Sepúlveda Mora
Sergio Alexander Castro Casadiego
Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla
Ingeniería
reconocimiento del habla
modelos acústicos
modelos de lenguajes
CMU Sphinx
Raspberry Pi.
title Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla
title_full Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla
title_fullStr Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla
title_full_unstemmed Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla
title_short Modelo Acústico y de Lenguaje del Idioma Español para el dialecto Cucuteño, Orientado al Reconocimiento Automático del Habla
title_sort modelo acustico y de lenguaje del idioma espanol para el dialecto cucuteno orientado al reconocimiento automatico del habla
topic reconocimiento del habla
modelos acústicos
modelos de lenguajes
CMU Sphinx
Raspberry Pi.
url https://revistas.udistrital.edu.co/ojs/index.php/reving/article/view/11616
work_keys_str_mv AT juandavidcelisnunez modeloacusticoydelenguajedelidiomaespanolparaeldialectocucutenoorientadoalreconocimientoautomaticodelhabla
AT rodrigoandresllanoscastro modeloacusticoydelenguajedelidiomaespanolparaeldialectocucutenoorientadoalreconocimientoautomaticodelhabla
AT byronmedinadelgado modeloacusticoydelenguajedelidiomaespanolparaeldialectocucutenoorientadoalreconocimientoautomaticodelhabla
AT sergiobasiliosepulvedamora modeloacusticoydelenguajedelidiomaespanolparaeldialectocucutenoorientadoalreconocimientoautomaticodelhabla
AT sergioalexandercastrocasadiego modeloacusticoydelenguajedelidiomaespanolparaeldialectocucutenoorientadoalreconocimientoautomaticodelhabla