Un buscador multilingüe responde en cualquier idioma
Investigadores del Grupo de Validación y Aplicaciones Industriales (VAI) de la Facultad de Informática de la Universidad Politécnica de Madrid (FIUPM) han desarrollado un motor de búsqueda multilingüe que permite lanzar una pregunta en cualquier lengua a un repositorio de contenidos escritos en una interlingua y obtener una respuesta de gran precisión en la misma lengua.
El buscador multilingüe es un sistema de pregunta-respuesta que tiene la finalidad de contestar de forma precisa a preguntas sobre hechos formuladas en la lengua materna del usuario. Por ejemplo: "¿Quién descubrió América y en qué año?" La respuesta obtenida por este sistema sería "Cristóbal Colón en 1492".
La novedad de este sistema es que la pregunta puede ser formulada en inglés, francés, español o cualquier otra lengua, y la respuesta se obtiene en la misma lengua en que ha sido formulada sin que medie ninguna traducción de una lengua a otra, ya que la base de la información que se busca está en UNL.
Más información
La interlingua es una representación de contenidos independiente de la lengua. Según la FIUPM, en la actualidad, la única interlingua viva y de propósito general, con estándares, manuales y organizaciones que se ocupan de ella, es el UNL (Universal Networking Language), de la Universidad de las Naciones Unidas, que fue creada para eliminar las barreras lingüísticas en Internet. El VAI es el soporte de UNL para la lengua española.
El sistema desarrollado por investigadores de la FIUPM explota las características de la representación en UNL de la pregunta del usuario para encontrar la respuesta, considerando que la respuesta está implícita en la pregunta. Por lo tanto, lo que hace el buscador no es encontrar la respuesta, sino que la deduce de la pregunta.
El motor de búsqueda es el encargado de encontrar la respuesta en la base documental escrita en UNL siguiendo la secuencia: primero busca frases del texto que podrían tener la respuesta, segundo, de ese conjunto de oraciones determina cuál tiene la respuesta y cuál es la respuesta. A continuación, genera la respuesta en la misma lengua en que fue formulada.
Un 82% de aciertos
Los resultados obtenidos con esta investigación son muy prometedores: 82% de aciertos precisos. Se han formulado 75 preguntas de diferente tipo (cuándo, cómo, quién), sabiendo de antemano cuál es la respuesta correcta. También se han formulado preguntas sin respuesta en el repositorio para determinar el comportamiento del sistema en este supuesto.
Según la FIUPM, los resultados obtenidos confirman la validez de este buscador para el desarrollo de sistemas pregunta-respuesta multilingües.
Los resultados de esta investigación, desarrollada por el director del VAI, Jesús Cardeñosa, en colaboración con otros dos expertos, se presentaron en la '8th International Conference FQAS 2009' en octubre y se han publicado en 'Lecture Notes in Artificial Intelligence 5822' en Septiembre.