Aproximación a una estación lexicológica orientada a internet

Autor: Zenón Fernández Figueroa

Director: Octavio Santana Suárez

Resumen:
    Esta tesis es una proyección natural de los trabajos realizados por el Grupo de Estructuras de Datos y Lingüística Computacional de la ULPGC en los últimos años. Estos trabajos se han desarrollado en el ámbito de la Lingüística Computacional y han dado lugar, entre otros resultados, al desarrollo de herramientas de reconocimiento y generación morfológica. En esta tesis se propone la utilización de dichas herramientas como parte de nuevas aplicaciones cuyo objetivo es obtener provecho del enorme caudal de información lingüística que supone Internet. Se caracterizan dos clases de aplicaciones —en función del grado de interactividad de los estudios lingüísticos que se pretenda realizar— y se desarrollan sendos prototipos —denominados DAWeb y NAWeb— con una arquitectura estudiada para obtener los rendimientos más adecuados a cada caso. Las modalidades de análisis abarcan: la detección de neologismos, estudio del uso de las palabras con diversas medidas cuantitativas y cualitativas, y aspectos cercanos a la sintaxis tales como colocaciones léxicas o regímenes preposicionales. Ambas aplicaciones aportan un novedoso complemento al concepto de Estación Lexicológica que algunos autores —especialmente en el campo de la lexicografía— han postulado con anterioridad, centrándose sobre todo en la gestión de la información disponible —mediante sistemas de bases de datos— y la generación de productos a partir de la misma —diccionarios.

Descargar la tesis en formato pdf (1094Kb)

27 - Mayo - 2002

Home