ciberpa@is   PORTADA | CIBERNAUTAS | TECNOLOGÍA | CIBERSOCIEDAD | OCIO
Jueves 25 de noviembre de 1999   ../../graficos/bolo.gif (72 bytes) TECNOLOGÍA
Automatización del análisis de las palabras
La sustitución del CD por el DVD
Programas
 

Octavio Santana y José Pérez Aguilar del Grupo de Lingüística Computacional. (R. Avero)
  Un grupo canario automatiza el análisis de las palabras del español 
Flape es un procesador morfológico que aproxima la utopía de hablar con las máquinas 


Miquel Barceló
El lenguaje no deja de ser un misterio. Nuestro cerebro, entrenado tras años de aprendizaje, es capaz de reconocer que casona deriva de casa, que vaca es el femenino de toro , que matrices es el plural de matriz , que sapientísimo es el superlativo de sabio, y que decídnoslo deriva del verbo decir. Parece difícil imitar cualquiera de estos pocos ejemplos de las muy diversas formas que toman las palabras. Pese a ello, un grupo de investigadores de la Universidad de Las Palmas está poniendo los cimientos de un procesador de lenguaje que imite esa capacidad del cerebro.
 
 

En opinión del Grupo de Estructuras de Datos y Lingüística Computacional que dirige Octavio Santana en el campus de Tafira de la Universidad de Las Palmas de Gran Canaria, el primer paso para el tratamiento automatizado del lenguaje debería llegar a partir del estudio y tratamiento correcto de la morfología de la lengua.
 
 

"El interés que despierta un procesador morfológico", subraya Santana, "radica en que el tratamiento automatizado de la morfología del español constituye la primera piedra sobre la cual construir cualquier procesador de lenguaje natural". Un futuro procesador de lenguaje que, una vez determinado el origen de una palabra tras el estudio morfológico, pueda considerar la sintaxis, la semántica y toda la operativa de la lengua, desde la traducción automática al análisis de textos.
 
 

El tema del tratamiento informatizado del lenguaje forma parte del imaginario social en torno a lo que deben conseguir los ordenadores en un futuro: lograr que nos podamos dirigir a ellos en eso que llamamos lenguaje natural y, además, que los programas nos ayuden con potencialidades lingüísticas útiles para superar la torre de babel de los lenguajes que tantas veces nos separan.
 
 

En el proyecto del Grupo de Estructuras de Datos y Lingüística Computacional todo eso empieza con un procesador morfológico del lenguaje llamado Flape (Flexionador y lematizador de palabras del español), accesible en Internet.
 
 

La morfología de una lengua como el español es compleja y amplia.
 
 

Dispone de una serie de formas canónicas (casa, azul, leer) que pueden resultar flexionadas y derivadas por múltiples causas: variaciones de género y número en los sustantivos, adjetivos, artículos y participios verbales; conjugación de verbos; derivaciones apreciativas; diminutivos y superlativos; y un largo etcétera.
 
 

El Grupo de Estructuras de Datos y Lingüística Computacional ha partido de un conjunto de diccionarios de los que ha obtenido las 124.444 formas canónicas distintas que hoy maneja. Dichas formas se convierten, al flexionarlas y derivarlas, en un universo de más de 3,3 millones de formas no verbales; un millón de formas conjugadas simples y otras tantas compuestas; y hasta unos 20 millones de formas verbales al incorporar uno, dos, o tres pronombres enclíticos. Nuestro cerebro, entrenado tras largos años de aprendizaje, es capaz de operar con todas esas formas y reconocerlas, pero su simple almacenaje rutinario, imprescindible si no se dispusiera de un procesador morfológico como Flape, ocuparía seguramente más de treinta gigabytes.
 
 

Con Flape no hace falta almacenarlo todo, bastan las formas canónicas, las reglas de formación de flexiones y derivaciones y las siempre tan abundantes excepciones. Flape es un lematizador que, dada cualquier palabra del español, identifica la forma canónica de la que procede con indicación de su categoría gramatical y la flexión o derivación. También, en sentido contrario, puede operar como un flexionador capaz de generar una determinada forma flexionada o derivada a partir de la forma canónica.
 
 

El proyecto resulta ya operativo y, en opinión de sus creadores, puede ser la primera piedra sobre la cual construir cualquier procesador de lenguaje natural. Hay aplicaciones inmediatas en la enseñanza de la lengua, el manejo de diccionarios, la creación de motores para búsquedas textuales, el análisis y la generación de texto.
 
 

Se trata de una investigación académica en informática que, tal vez excepcionalmente, da sus frutos concretos y los pone al alcance de todos. Y también, de pasada, nos permite sorprendernos de cómo un dispositivo como nuestro cerebro es capaz de poner orden en la escalofriante multiplicidad de formas de las palabras con las que nos expresamos cada día.
 
 

Si herramientas como Flape nos pueden sorprender, todavía sigue haciéndolo eso que tal vez pronto acabemos llamando el cerebro natural. 

 
Flape analiza las palabras en la red

El Grupo de Estructuras de Datos y Lingüística Computacional de la Universidad de Las Palmas dispone de una página web para difundir los resultados de sus investigaciones. En ella se permite que todo el mundo pueda operar y probar discrecionalmente su más reciente logro, el Flape (Flexionador y lematizador de palabras del español), un procesador morfológico para todas las formas del idioma.
 
 

Flape analiza cualquier palabra que se someta a su estudio mediante su segmentación en posibles pares raíz-terminación, la localización de cada una de las raíces posibles, la decodificación de la terminación concreta de esa palabra y, finalmente, la construcción final de la forma canónica de la que proviene. En el resultado se incluye también la categoría gramatical de la palabra analizada.
 
 

En sentido inverso, cuando opera como flexionador Flape detecta primero la raíz y, después, procede a buscar la terminación que corresponda a la forma que se desee conseguir. 

Ocho diccionarios

Las 124.444 formas canónicas que hoy maneja Flape son las entradas de ocho obras:
 
 

el Diccionario de la Lengua Española de la Real Academia , el Diccionario General de la Lengua Española Vox , el Diccionario de Uso del Español de María Moliner, el Gran Diccionario de la Lengua Española de Larousse-Planeta, el Diccionario de Uso del Español Actual Clave , el Diccionario de Voces de Uso Actual dirigido por Manuel Alvar Ezquerra, el Gran Diccionario de Sinónimos y Antónimos de Espasa-Calpe y el Diccionario Ideológico de la Lengua Española de Casares.


Flape

paislogo.gif (1422 bytes)
Suplementos
TENTACIONES

PORTADA | CIBERNAUTAS | TECNOLOGÍA | CIBERSOCIEDAD | OCIO

DESDE EL PACÍFICO | LA NOTICIA EN LA RED | CIENCIA FICCIÓN
GRATIS | PARA EMPEZAR

ÍNDICE | AGENDA

 

© Copyright DIARIO EL PAIS, S.A. - Miguel Yuste 40, 28037 Madrid (España)
ciberpais@elpais.es | publicidad@elpais.es