Desarrollo de un sistema de diálogo oral en dominios restringidos. Bonafonte, A.; Aibar, P.; Castell, N.; Lleida, E.; Mariño, J. B; Sanchis, E.; and Torres, M. I. In López Soto, M. T. and López-Cózar, R., editors, I Jornadas en Tecnología del Habla. Universidad de Sevilla - Universidad de Granada - Red Temática en Tecnologías del Habla, Sevilla.
Desarrollo de un sistema de diálogo oral en dominios restringidos [pdf]Paper  abstract   bibtex   
En esta comunicación se describe el proyecto titulado "Desarrollo de un Sistema de Diálogo Oral en Dominios Restringidos"; proyecto financiado por la CICYT que empezó en octubre de 1998 y terminará en septiembre del 2001. El objetivo de dicho proyecto es investigar metodologías y tecnología para desarrollar interfaces orales. La tarea que se ha escogido como sustento de dicha investigación es la de consulta sobre horarios y precios de trenes regionales y grandes líneas. El objetivo del proyecto se concretará mediante la implementación de un sistema prototipo que ofrezca dicha información. En este momento, en el proyecto se han producido dos corpora. En el primero de ellos (corpus persona- persona) se han adquirido y transcrito 200 conversaciones de usuarios que llamaban al centro de información de RENFE. Este corpus se utilizó para analizar el dominio semántico de la tarea y sirvió de referencia al definir las estrategias de diálogo y generación de respuesta. También se utilizo como referencia al generar escenarios (situaciones) que pueden utilizarse al solicitar llamadas de colaboradores voluntarios al sistema. En el segundo corpus (OZ1) se han adquirido 225 diálogos siguiendo el paradigma del Mago de Oz, utilizados en la inferencias de modelos y reglas a distintos niveles: modelos de lenguaje para reconocimiento y para comprensión, modelo probabilístico de actos de diálogos, etc. Dado que las prestaciones de los sistemas de reconocimiento empeoran sustancialmente al reconocer la llamada habla espontánea (frente a lectura), una de las actividades del proyecto se ha centrado en el análisis, etiquetado, modelado y tratamiento de los así denominados fenómenos de habla espontánea. Se ha realizado un etiquetado exhaustivo del corpus OZ1 y se ha definido un esquema de anotación. Actualmente se está estudiando el modelado --acústico, léxico, sintáctico- de algunos de los fenómenos etiquetados con objeto de mejorar las tasas de reconocimiento. En el proyecto se está implementado un sistema distribuido, donde cada desarrollador de un módulo lo activa en forma de servidor. Esta arquitectura flexible facilita la colaboración entre los distintos grupos de trabajos y facilita el test de varias alternativas para cada módulo, disponer de un prototipo con la última versión de cada uno de los módulos, etc. En la comunicación se describen brevemente los componentes del sistema: servidor de audio, gestor de la aplicación, reconocimiento del habla, comprensión del habla, gestor del diálogo, generación de respuesta y conversión de texto a habla.
@incollection{bonafonte_desarrollo_2000,
	Address = {Sevilla},
	Author = {Bonafonte, Antonio and Aibar, Pablo and Castell, Núria and Lleida, Eduardo and Mariño, José B and Sanchis, Emilio and Torres, María Inés},
	Booktitle = {I Jornadas en Tecnología del Habla},
	Date = {2000},
	Date-Modified = {2016-09-23 19:22:33 +0000},
	Editor = {López Soto, María Teresa and López-Cózar, Ramón},
	Keywords = {dialogue systems, Spanish, speech technology},
	Publisher = {Universidad de Sevilla - Universidad de Granada - Red Temática en Tecnologías del Habla},
	Title = {Desarrollo de un sistema de diálogo oral en dominios restringidos},
	Url = {http://gps-tsc.upc.es/veu/basurde/download/Bon00a_sevilla.pdf},
	Abstract = {En esta comunicación se describe el proyecto titulado "Desarrollo de un Sistema de Diálogo Oral en Dominios Restringidos"; proyecto financiado por la CICYT que empezó en octubre de 1998 y terminará en septiembre del 2001. El objetivo de dicho proyecto es investigar metodologías y tecnología para desarrollar interfaces orales. La tarea que se ha escogido como sustento de dicha investigación es la de consulta sobre horarios y precios de trenes regionales y grandes líneas. El objetivo del proyecto se concretará mediante la implementación de un sistema prototipo que ofrezca dicha información. En este momento, en el proyecto se han producido dos corpora. En el primero de ellos (corpus persona- persona) se han adquirido y transcrito 200 conversaciones de usuarios que llamaban al centro de información de RENFE. Este corpus se utilizó para analizar el dominio semántico de la tarea y sirvió de referencia al definir las estrategias de diálogo y generación de respuesta. También se utilizo como referencia al generar escenarios (situaciones) que pueden utilizarse al solicitar llamadas de colaboradores voluntarios al sistema. En el segundo corpus (OZ1) se han adquirido 225 diálogos siguiendo el paradigma del Mago de Oz, utilizados en la inferencias de modelos y reglas a distintos niveles: modelos de lenguaje para reconocimiento y para comprensión, modelo probabilístico de actos de diálogos, etc. Dado que las prestaciones de los sistemas de reconocimiento empeoran sustancialmente al reconocer la llamada habla espontánea (frente a lectura), una de las actividades del proyecto se ha centrado en el análisis, etiquetado, modelado y tratamiento de los así denominados fenómenos de habla espontánea. Se ha realizado un etiquetado exhaustivo del corpus OZ1 y se ha definido un esquema de anotación. Actualmente se está estudiando el modelado --acústico, léxico, sintáctico- de algunos de los fenómenos etiquetados con objeto de mejorar las tasas de reconocimiento. En el proyecto se está implementado un sistema distribuido, donde cada desarrollador de un módulo lo activa en forma de servidor. Esta arquitectura flexible facilita la colaboración entre los distintos grupos de trabajos y facilita el test de varias alternativas para cada módulo, disponer de un prototipo con la última versión de cada uno de los módulos, etc. En la comunicación se describen brevemente los componentes del sistema: servidor de audio, gestor de la aplicación, reconocimiento del habla, comprensión del habla, gestor del diálogo, generación de respuesta y conversión de texto a habla.},
	Bdsk-File-1 = {YnBsaXN0MDDUAQIDBAUGJCVYJHZlcnNpb25YJG9iamVjdHNZJGFyY2hpdmVyVCR0b3ASAAGGoKgHCBMUFRYaIVUkbnVsbNMJCgsMDxJXTlMua2V5c1pOUy5vYmplY3RzViRjbGFzc6INDoACgAOiEBGABIAFgAdccmVsYXRpdmVQYXRoWWFsaWFzRGF0YW8QYAAuAC4ALwAuAC4ALwAuAC4ALwBCAGkAYgBsAGkAbwBnAHIAYQBmAGkAYQAvAFAAYQBwAGUAcgBzAC8AQgBvAG4AYQBmAG8AbgB0AGUALwBEAGUAcwBhAHIAcgBvAGwAbABvACAAZABlACAAdQBuACAAcwBpAHMAdABlAG0AYQAgAGQAZQAgAGQAaQBhAwEAbABvAGcAbwAgAG8AcgBhAGwAIABlAG4AIABkAG8AbQBpAG4AaQBvAHMALgBwAGQAZtIXCxgZV05TLmRhdGFPEQJaAAAAAAJaAAIAAAxNYWNpbnRvc2ggSEQAAAAAAAAAAAAAAAAAAADL9h/OSCsAABCGZ74fRGVzYXJyb2xsbyBkZSB1biBzIzEwODY2N0MwLnBkZgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAEIZnwNPqPLEAAAAAAAAAAAADAAQAAAkgAAAAAAAAAAAAAAAAAAAACUJvbmFmb250ZQAAEAAIAADL9gOuAAAAEQAIAADT6iCRAAAAAQAUEIZnvhCGZY4ABfxHAAX7mAAAwEYAAgBnTWFjaW50b3NoIEhEOlVzZXJzOgBqb2FxdWltX2xsaXN0ZXJyaToAQmlibGlvZ3JhZmlhOgBQYXBlcnM6AEJvbmFmb250ZToARGVzYXJyb2xsbyBkZSB1biBzIzEwODY2N0MwLnBkZgAADgB0ADkARABlAHMAYQByAHIAbwBsAGwAbwAgAGQAZQAgAHUAbgAgAHMAaQBzAHQAZQBtAGEAIABkAGUAIABkAGkAYQMBAGwAbwBnAG8AIABvAHIAYQBsACAAZQBuACAAZABvAG0AaQBuAGkAbwBzAC4AcABkAGYADwAaAAwATQBhAGMAaQBuAHQAbwBzAGgAIABIAEQAEgBwVXNlcnMvam9hcXVpbV9sbGlzdGVycmkvQmlibGlvZ3JhZmlhL1BhcGVycy9Cb25hZm9udGUvRGVzYXJyb2xsbyBkZSB1biBzaXN0ZW1hIGRlIGRpYcyBbG9nbyBvcmFsIGVuIGRvbWluaW9zLnBkZgATAAEvAAAVAAIAGP//AACABtIbHB0eWiRjbGFzc25hbWVYJGNsYXNzZXNdTlNNdXRhYmxlRGF0YaMdHyBWTlNEYXRhWE5TT2JqZWN00hscIiNcTlNEaWN0aW9uYXJ5oiIgXxAPTlNLZXllZEFyY2hpdmVy0SYnVHJvb3SAAQAIABEAGgAjAC0AMgA3AEAARgBNAFUAYABnAGoAbABuAHEAcwB1AHcAhACOAVEBVgFeA7wDvgPDA84D1wPlA+kD8AP5A/4ECwQOBCAEIwQoAAAAAAAAAgEAAAAAAAAAKAAAAAAAAAAAAAAAAAAABCo=},
	Bdsk-Url-1 = {http://gps-tsc.upc.es/veu/basurde/download/Bon00a_sevilla.pdf}}
Downloads: 0