miércoles, 21 de octubre de 2009

Materiales de lectura: clase para el 21/10/2009

Saludos a todos:

Les mando el siguiente material de consulta para la clase, el cual creo que les puede ser útil para abordar lo que iremos viendo sobre chunking y parsing.

1. Una lectura del manual de Jurafsky y Martin sobre cómo construir una gramática formal para el inglés, considerando precisamente cosas que ya discutimos en otras clases: gramáticas libres de contexto, expresiones regulares, corpus lingüísticos anotados, etc.

2. Una liga a un libro escritor por Sofía Galicia (Facultad de Ciencias de la UNAM) y Alexander Gelbukh (CIC-IPN), dedicado al estudio de la sintaxis del español desde un enfoque computacional. Una parte interesante de este libro es el recorrido histórico que hacen Galicia y Gelbukh sobre los dintintos modelos de gramáticas formales que se conocen y se usan en lingüística computacional, entre otras cosas que pueden revisar.

3. Un artículo elaborado por Aoife Cahill (
Universität Stuttgart), en donde da una descripción bastante puntual sobre la relación existente entre gramáticas formales, treebanks y métodos probabilísticos.

4. Finalmente, una aplicación real para detectar estructuras sintácticas (frases y oraciones) en un corpus etiquetado para el español: el proyecto Ancora, elaborado en colaboración por la Universidad de Barcelona, la Universidad Politécnica de Catalunya y la Universidad del País Vasco. Para mayores detalles, pueden acceder a tal proyecto dando un clic aquí.

En un momento más añado las láminas de la clase. Suerte con todo.

No hay comentarios:

Publicar un comentario