Flexionador y lematizador de palabras del español
( etiquetador morfológico - analizador morfológico )
( lemmatizer - morphologic tagger - morphologic analyzer )

Introduzca una forma para lematizar:  

[English]
 La aplicación informática que se presenta lematiza cualquier palabra del español al identificar su forma canónica, categoría gramatical y la flexión o derivación que la produce, y obtiene las formas correspondientes a partir de una forma canónica y de la flexión o derivación solicitada; tanto el reconocimiento como la generación operan sobre una misma estructura de datos, recorrerla en sentidos contrarios implica que la herramienta funcione en una u otra modalidad.

 En los verbos, trata la conjugación simple y compuesta, los pronombres enclíticos, la flexión del participio como adjetivo verbal (género, número) y el diminutivo del gerundio. Con las formas no verbales, considera: género y número en los sustantivos, adjetivos, pronombres y artículos; heteronimia por cambio de sexo en los sustantivos; grado superlativo en los adjetivos y adverbios; adverbialización del superlativo en los adjetivos; derivación apreciativa en los sustantivos, adjetivos y adverbios; variantes gráficas en todas las categorías gramaticales; formas invariantes tales como preposiciones, conjunciones, exclamaciones, palabras de otros idiomas y locuciones o frases. Tanto en la lematización como en la generación se contempla la prefijación.

 Permite el reconocimiento, la generación y la manipulación de las relaciones morfoléxicas a partir de cualquier palabra, incluye la recuperación de toda su información lexicogenética hasta llegar a una primitiva, la gestión y control de los afijos en el tratamiento de sus relaciones, así como la regularidad en la relación establecida. Proporciona una visión global del comportamiento y productividad de las palabras del español en los principales procesos de formación (sufijación, prefijación, parasíntesis, supresión, regresión, modificación-cero, apócope, metátesis y otros no clasificables que generan grafías alternativas).

 A partir de 151103 formas canónicas (incluye 14859 nombres de personas y apellidos), se obtienen algo más de 4900000 formas flexionadas y derivadas (sin sumar la ampliación inherente a los prefijos y a los pronombres enclíticos) y se establecen unas 90000 relaciones morfoléxicas. El sistema incluye todas las entradas del Diccionario de la Lengua Española de la Real Academia, del Diccionario General de la Lengua Española Vox, del Diccionario de Uso del Español de María Moliner, del Gran Diccionario de la Lengua Española de Larousse Planeta, del Diccionario de Uso del Español Actual Clave SM (1), del Diccionario de voces de uso actual dirigido por Manuel Alvar Ezquerra(2), del Gran Diccionario de Sinónimos y Antónimos de Espasa-Calpe y del Diccionario Ideológico de la Lengua Española de Julio Casares.

[Artículos relacionados]

(1) Queremos expresar nuestro agradecimiento a Ediciones SM por su desinteresada colaboración.
(2) Nuestra especial consideración al constante respaldo lingüístico del Dr. Manuel Alvar Ezquerra.


[ Flexión verbo ]    [ Flexión sustantivo ]    [ Flexión adjetivo ]     [ Flexión otras formas ]    [ Relaciones morfoléxicas ]

[ Desambiguador local ]    [ Desambiguador morfosintático ]


  The tool that is presented lemmatizes any Spanish word, that is to say, it obtains its morphological information. It identifies its canonical form, grammatical category and inflection or derivation. The application also obtains the corresponding forms from a canonical form and from the flexion or derivation requested. Both the recognition and the generation work on the same data structure. To go through it inversely means that the tool works in both ways (either through recognition or generation).

 For verbs, it is applied to the simple and compound conjugation, enclitic pronouns and flexion of the past participle as a verbal adjective and the diminutive form of the gerund. In relation to non-verbal forms, it considers the gender and number of nouns, adjectives, pronouns and articles, heteronyms by a change of “sex” in the nouns, a superlative degree in the adjectives and adverbs, the verbalisation of the superlative for adjectives; derivation by prefixes and suffixes in the nouns, adjectives and adverbs; different graphical forms for all the grammatical categories; invariable forms such as prepositions, conjunctions, exclamations, words from other languages and idiomatic expressions or phraseology. This is the case in both the identification process and in the generation process where prefixation is taken into account.

 It permits the recognition, generation and manipulation of the morpholexical relationships from any given word, including that retrieval of all its lexicogenetic information right up until it arrives at a primitive relationship, the management and control of the affixes in the treatment of its relations, as well as the regularity in the established relationship. It projects a global vision of the behaviour and productivity of Spanish words in the primary word-formation processes, such as suffixation, prefixation, parasynthesis, suppression, regression, zero-modification, apocopation, metathesis, and other non-classifiable processes that generate alternative graphical forms.

 From 151103 canonical forms (including 14859 people’s names and surnames), you can obtain more than 4900000 inflected forms and derived forms (without counting the inherent amplifying of prefixes and enclitic pronouns) and some 90000 morpholexical relationships can be created. The system includes all the entries of the Royal Academy Spanish Language dictionary, from the Vox General Dictionary of the Spanish Language, from the Maria Moliner Dictionary of Spanish Usage, from the Larousse Planet Dictionary of the Spanish Language, from the Clave SM Dictionary of Current Spanish Usage(1), from the Manual Alvar Ezquerra dictionary(2), from the Espasa-Calpe Great Dictionary of synonyms and antonyms and from Julio Casares’s Ideological Dictionary of the Spanish Language.

[Related papers]

(1) We want to express our gratefulness to Ediciones SM by its disinterested collaboration.
(2) Our special consideration to the constant linguistic support of the Dr. Manuel Alvar Ezquerra.


[ Verb inflection ]    [ Noun inflection ]    [ Adjective inflection ]     [ Other forms inflection ]    [ Morpholexical relationships ]

[ Local disambiguator ]     [ Morphosyntactic disambiguator ]


Artículos relacionados / Related papers:

NAWeb: un navigateur et analyseur morphologique des pages web pour l'espagnol.
Una Herramienta de Recuperación Morfoléxica Aplicada a Microsoft Word.
NAWeb: Un navigateur et analyseur morphologique des pages web.
The Spanish Morphology in Internet.
Morphoanalysis of Spanish Text: Two Applications for Web Pages.
DAWEB: Un descargador y analizador morfológico de páginas Web.
FLANOM: Flexionador y lematizador automático de formas nominales.
Reconocedor y generador automático de formas nominales.
FLAVER: Flexionador y lematizador automático de formas verbales.
Reconocedor de conjugación en formas verbales que trata los pronombres enclíticos.


Si desea descargar una demostración en PowerPoint: Demostración.zip (una vez descomprimido se genera el fichero Demostración.pps, la extensión pps abre el visualizador de PowerPoint) o descargue Demostración.pps

Pulse aquí si desea que le mantengamos informado sobre futuras actualizaciones de las aplicaciones existentes y nuevas incorporaciones


Enviar sugerencias a: José R. Pérez Aguiar

Última actualización: 06 - 04 - 2006

(C) Grupo de Estructuras de Datos-ULPGC

Accesos registrados desde el 16 - Noviembre - 1998: