domingo, 25 de octubre de 2009

Materiales de lectura para la clase: 28/10/09

Saludos a todos:

Como complemento al tema que vamos a ver en clase, anexo las siguientes lecturas, por si les interesa profundizar en la cuestión del parsing usando algún modelo de gramática formal. La idea entonces es la siguiente:

1. Para tener un panorama general sobre qué es parsing, así como el uso que esta tarea se hace de las gramáticas libres de contexto (Context-Free Grammars, CFGs), pueden ver el capítulo 13 del libro de Jurafsky y Martin.

2. Una gramática que trabaja en un nivel inmediato a las CFGs son las llamadas gramáticas de adición de árboles (o Tree Adjoining Grammars, TAGs), desarrolladas por Aravind K. Joshi (1929). Este modelo es útil para entender el concepto de gramática formal, además de que computacionalmente es sencillo de implementar. Si quieren profundizar en ellas, anexo un artículo extenso, el cual no es para que lo terminen ahora, pero creo que les puede servir como texto de consulta.

3. Hasta hoy día, las TAGs procesan todavía frases y oraciones de forma simple y plana. Empero, recientemente se ha tratado de añadirles rasgos léxicos y semánticos, Una vía para hacer esto ha sido considerar el uso de gramáticas basadas en rasgos (Feature-Based Grammars, FBGs). Esta clase de gramáticas proponen la selección de rasgos morfosintácticos, léxicos y semánticos relevantes para hacer parsing. Tales rasgos son codificadas en matrices que van asociadas a un ítem (p.e., una palabra o una frase). El texto que les presento es de John Blevins, en donde explica a detalle en qué consisten las FBGs.

4. Finalmente, una gramática que aprovecha al máximo esta inserción de matrices de rasgos para tratar de hacer un análisis léxico-sintáctico de una oración es la gramática léxico-funcional (Lexical-Functional Grammar, LFG), formulada por Joan Bresnan y Ronald Kaplan. El artículo que anexo lo escribió Mary Dalrymple, con miras a establecer una breve introducción a esta gramática.

Junto con estos textos, también pueden consultar las siguientes páginas WEB:

1. Un parser on-line desarrollado por
Aoife Cahill, de la Universidad de Stuttgart, el cual hace sus análisis basado en la gramática léxica funcional. Trabaja únicamente para el inglés. Si quieren jugar con él, pueden hacerlo a través de este sitio: http://lfg-demo.computing.dcu.ie/lfgparser.html

2. La misma Universidad de Stuttgart ha elaborado un corpus para el alemán, usando etiquetas morfosintácticas basadas en LFG. A este corpus se le conoce como el Tiger Corpus, el cual, aparte de brindar su sistema de etiquetas, también cuenta con una interfaz de consulta sintáctica. Pueden acceder al Tiger Corpus a través de esta liga: www.ims.uni-stuttgart.de/projekte/TIGER/TIGERCorpus/.

Creo que con esto tienen bastantes cosas para pensar un poco sobre la cuestión del parsing. Dentro de poco añado las láminas de la clase.

Suerte con todo.

No hay comentarios:

Publicar un comentario