Saludos a todos:
Les mando el siguiente material de consulta para la clase, el cual creo que les puede ser útil para abordar lo que iremos viendo sobre chunking y parsing.
1. Una lectura del manual de Jurafsky y Martin sobre cómo construir una gramática formal para el inglés, considerando precisamente cosas que ya discutimos en otras clases: gramáticas libres de contexto, expresiones regulares, corpus lingüísticos anotados, etc.
2. Una liga a un libro escritor por Sofía Galicia (Facultad de Ciencias de la UNAM) y Alexander Gelbukh (CIC-IPN), dedicado al estudio de la sintaxis del español desde un enfoque computacional. Una parte interesante de este libro es el recorrido histórico que hacen Galicia y Gelbukh sobre los dintintos modelos de gramáticas formales que se conocen y se usan en lingüística computacional, entre otras cosas que pueden revisar.
3. Un artículo elaborado por Aoife Cahill (Universität Stuttgart), en donde da una descripción bastante puntual sobre la relación existente entre gramáticas formales, treebanks y métodos probabilísticos.
4. Finalmente, una aplicación real para detectar estructuras sintácticas (frases y oraciones) en un corpus etiquetado para el español: el proyecto Ancora, elaborado en colaboración por la Universidad de Barcelona, la Universidad Politécnica de Catalunya y la Universidad del País Vasco. Para mayores detalles, pueden acceder a tal proyecto dando un clic aquí.
En un momento más añado las láminas de la clase. Suerte con todo.
miércoles, 21 de octubre de 2009
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario