Download Parte3 - AITADIS

Transcript
Actas del VII Congreso Iberoamericano de Tecnologías de Apoyo a la Discapacidad 2013
Fase
Cantidad de Muestras
Entrenamiento
7867
Prueba
1133
Tabla 3. Detalle del corpus
Métodos de extracción de características
Precisión del reconocedor
MFCC ( Coeficientes Cepstrales en Escala de Mel)
79.60%
LPC(Coeficientes de Predicción lineal)
78.86%
PLP (Coeficientes de Predicción Lineal Perceptual)
80.51%
Tabla 4. Tasas de reconocimiento
Para la interfaz de usuario se hizo “playtesting” con un grupo piloto de treinta niños en el INCSVC, con el fin
de evaluar la aceptación de la propuesta argumental, los personajes y la interfaz, así como su usabilidad.
Muchas de estas directrices para los objetivos de las pruebas se citan en [2]. Se usaron dos mini juegos con
el mismo ejercicio de mecanización (palabra diduda) y dos métricas definidas: tiempo promedio de
reconocimiento de la palabra y tiempo promedio de terminación de la tarea, realizando el proceso completo
de captura del audio, reconocimiento de palabra, y realimentación al usuario de manera gráfica mediante el
videojuego (1 ejercicio, 10 repeticiones de palabra). Se obtuvieron los datos mostrados en la Tabla 5:
Ejercicio “di-du-da”
Tiempo promedio para
Reconocimiento de la palabra
Tiempo promedio
terminación de tarea
Mini juego 1 (oso hambriento)
0.6702 segundos
6.48 minutos
Mini juego 2 (lianas)
0.6404 segundos
4.57 minutos.
Tabla 5. Resultado en las pruebas del prototipo
Algunas capturas del prototipo usado se muestran en la Figura 4. La Figura 5 muestra el uso de la
herramienta por parte del niño con discapacidad auditiva, en el que realiza los mismos ejercicios de
mecanización dados por su fonoaudiólogo.
4. Conclusiones y trabajos futuros
Los experimentos preliminares indican que, en cuanto al reconocimiento de patrones correspondientes a
defectos de habla en niños, el mejor método para la representación de señales acústicas es PLP, con una
tasa de reconocimiento de 80.51%, siendo el método escogido para el prototipo final. En las pruebas
realizadas, el reconocedor del prototipo presentó en general, un buen desempeño bajo condiciones de
ruidos normales en el INCSVC, como niños llorando
Con respecto a la interfaz gráfica, el videojuego encontró una respuesta positiva en los niños, mostrándose
como una herramienta adecuada para mantener la atención y el entusiasmo en tareas rutinarias como las
terapias. Los niños en general, entendieron la mecánica del juego y el objetivo de “alimentar a los animales”
para conseguir la recompensa, lo que representa un buen argumento principal para el juego.
Para trabajos futuros se tiene como meta, aumentar las tasas de precisión en el módulo de reconocimiento
del habla y ofrecer de esta manera, una realimentación más segura y detallada sobre el ejercicio realizado.
340