Asunto: Universidad. Novedad: Desambiguador morfosintáctico del español
Fecha: 17 de noviembre de 2004

Con el ánimo de poner al alcance de todos los interesados en el español esta útil herramienta, hemos incorporado a nuestra página (http://www.gedlc.ulpgc.es) para su uso gratuito y discrecional un desambiguador morfosintáctico del español basado en la estructura sintáctica de la frase u oración (http://www.gedlc.ulpgc.es/investigacion/desambigua/morfosintactico.htm).

Debido a que en español existe una considerable cantidad de palabras que pueden desempeñar diferentes funciones gramaticales, el análisis de un texto produciría una desmesurada multiplicidad de combinaciones posibles en caso de no tener en cuenta la función de cada voz en el contexto en que aparece.

El método de desambiguación reduce el tamaño de la respuesta gracias al tratamiento que hace de las estructuras sintácticas tanto locales como globales apoyándose en un analizador sintáctico automático --no usa criterios estadísticos.

Para cada palabra, el lematizador proporciona un conjunto de caracterizaciones gramaticales y léxicas, entre otras; el desambiguador asigna a cada caracterización un comportamiento funcional. El desambiguador discrimina para la categoría verbo entre cuatro opciones: infinitivo, gerundio, participio y forma verbal personal, ya que presentan diferencias de función y de posición en las estructuras sintácticas; por el mismo motivo, para la categoría pronombre, se distingue entre pronombre personal, pronombre de relativo y otro pronombre.

El universo que contempla está compuesto por más de 4 900 000 palabras (sin sumar la ampliación inherente a los prefijos y a los pronombres enclíticos), formado a partir de 151 103 formas canónicas (incluye 14 859 nombres de personas y apellidos).

Esta aplicación no propone una solución única, sino todas aquellas que aparecen aceptables al sistema. No tiene en cuenta aspectos semánticos en el análisis. En próximas versiones se irán depurando los resultados para aumentar el grado de desambiguación del sistema.

Esta versión de la aplicación, disponible para hacer pruebas en línea de manera libre y discrecional, tiene las entradas limitadas a 80 caracteres.

Nos agradaría que continuaran contribuyendo con sus aportaciones al mejor funcionamiento de nuestras herramientas.

Sería bueno que nos ayudaran a difundir por su medio la viabilidad que ofrecemos.

Un cordial saludo.


P.D.: Si no desea seguir recibiendo información responda a este correo indicando en el cuerpo "BORRAR".


Dr. Octavio Santana Suárez

Depto. de Informática y Sistemas
Campus Universitario de Tafira
Universidad de las Palmas de Gran Canaria
35017 Las Palmas de Gran Canaria
Tel.: (+34) 928458730
Fax.: (+34) 928458711
URL: http://www.gedlc.ulpgc.es
E-mail: osantana@dis.ulpgc.es