Download Parte3 - AITADIS
Transcript
Actas del VII Congreso Iberoamericano de Tecnologías de Apoyo a la Discapacidad 2013 Fase Cantidad de Muestras Entrenamiento 7867 Prueba 1133 Tabla 3. Detalle del corpus Métodos de extracción de características Precisión del reconocedor MFCC ( Coeficientes Cepstrales en Escala de Mel) 79.60% LPC(Coeficientes de Predicción lineal) 78.86% PLP (Coeficientes de Predicción Lineal Perceptual) 80.51% Tabla 4. Tasas de reconocimiento Para la interfaz de usuario se hizo “playtesting” con un grupo piloto de treinta niños en el INCSVC, con el fin de evaluar la aceptación de la propuesta argumental, los personajes y la interfaz, así como su usabilidad. Muchas de estas directrices para los objetivos de las pruebas se citan en [2]. Se usaron dos mini juegos con el mismo ejercicio de mecanización (palabra diduda) y dos métricas definidas: tiempo promedio de reconocimiento de la palabra y tiempo promedio de terminación de la tarea, realizando el proceso completo de captura del audio, reconocimiento de palabra, y realimentación al usuario de manera gráfica mediante el videojuego (1 ejercicio, 10 repeticiones de palabra). Se obtuvieron los datos mostrados en la Tabla 5: Ejercicio “di-du-da” Tiempo promedio para Reconocimiento de la palabra Tiempo promedio terminación de tarea Mini juego 1 (oso hambriento) 0.6702 segundos 6.48 minutos Mini juego 2 (lianas) 0.6404 segundos 4.57 minutos. Tabla 5. Resultado en las pruebas del prototipo Algunas capturas del prototipo usado se muestran en la Figura 4. La Figura 5 muestra el uso de la herramienta por parte del niño con discapacidad auditiva, en el que realiza los mismos ejercicios de mecanización dados por su fonoaudiólogo. 4. Conclusiones y trabajos futuros Los experimentos preliminares indican que, en cuanto al reconocimiento de patrones correspondientes a defectos de habla en niños, el mejor método para la representación de señales acústicas es PLP, con una tasa de reconocimiento de 80.51%, siendo el método escogido para el prototipo final. En las pruebas realizadas, el reconocedor del prototipo presentó en general, un buen desempeño bajo condiciones de ruidos normales en el INCSVC, como niños llorando Con respecto a la interfaz gráfica, el videojuego encontró una respuesta positiva en los niños, mostrándose como una herramienta adecuada para mantener la atención y el entusiasmo en tareas rutinarias como las terapias. Los niños en general, entendieron la mecánica del juego y el objetivo de “alimentar a los animales” para conseguir la recompensa, lo que representa un buen argumento principal para el juego. Para trabajos futuros se tiene como meta, aumentar las tasas de precisión en el módulo de reconocimiento del habla y ofrecer de esta manera, una realimentación más segura y detallada sobre el ejercicio realizado. 340