Plan docente de la asignatura

 

 

Català Castellano English Cerrar imatge de maquetació

 

Imprimir

 

Datos generales

 

Nombre de la asignatura: Lingüística Computacional

Código de la asignatura: 361749

Curso académico: 2024-2025

Coordinación: Itziar Aduriz Agirre

Departamento: Departamento de Filología Catalana y Lingüística General

Créditos: 6

Programa único: S

 

 

Horas estimadas de dedicación

Horas totales 150

 

Actividades presenciales y/o no presenciales

46

 

-  Teórico-práctica

Presencial

 

46

Trabajo tutelado/dirigido

50

Aprendizaje autónomo

54

 

 

Recomendaciones

 

— Conviene haber cursado previamente las asignaturas de Morfología, Sintaxis y Tecnologías de la Información y la Comunicación.
— La asignatura se imparte en catalán.

 

 

Competencias / Resultados de aprendizaje que se desarrollan

 

   -

Habilidad en la utilización de recursos informáticos, técnicos y audiovisuales

   -

Capacidad para aplicar los conocimientos lingüísticos adquiridos en el entorno social, laboral y personal.

   -

Habilidades de gestión de la información (habilidad para buscar y analizar información proveniente de fuentes diversas).

   -

Planteamiento y resolución de problemas metodológicos y conceptuales de manera autónoma y en equipo.

   -

Habilidades en la formalización lingüística

   -

Conocimiento y habilidades en tecnologías del lenguaje.

Objetivos de aprendizaje

 

Referidos a conocimientos

— Analizar la problemática que presenta el procesamiento del lenguaje natural (PLN) en el ámbito morfológico, sintáctico, léxico y semántico.

— Conocer las distintas aplicaciones de la lingüística computacional.

— Ver cómo se estructura la información lingüística en los distintos módulos de estas aplicaciones.

— Conocer las técnicas y métodos más comunes de análisis morfológico, sintáctico y semántico.

 

Referidos a habilidades, destrezas

— Adquirir habilidades tanto en el uso de herramientas y recursos informáticos para el análisis automático del lenguaje como en la formalización lingüística, indispensable en cualquier propuesta teórica y para el análisis descriptivo y/o computacional.

 

 

Bloques temáticos

 

1. ¿Qué entendemos por procesamiento del lenguaje natural (PLN)? ¿Qué objetivos tiene?

1.1. Áreas de investigación

1.2. Módulos estándar en los sistemas de PLN

1.3. Recursos lingüísticos

1.4. La ambigüedad del lenguaje: el gran reto del PLN

2. Técnicas, métodos y recursos asociados al análisis automático del lenguaje

2.1. Métodos empíricos y métodos basados en conocimiento

2.2. Técnicas, procesos y recursos de análisis morfológico

2.3. Técnicas, procesos y recursos de análisis sintáctico

2.4. Técnicas, procesos y recursos de análisis semántico

3. Aplicaciones del PLN

3.1. Traducción automática

3.2. Extracción de información: clasificación de documentos y resumen automático

3.3. Recuperación de información y búsqueda de respuestas

3.4. Análisis de sentimientos y minería de opiniones

3.5. Tecnologías del habla

 

 

Metodología y actividades formativas

 

Para entender la necesidad de formalización, implícita en una disciplina como es la lingüística computacional y sin la cual es imposible llevar a cabo el procesamiento del lenguaje natural, se combinan con un idéntico peso clases teóricas y clases prácticas, relacionadas estas últimas con la materia que se imparte en cada momento. Asimismo, las clases teóricas se complementan con unas lecturas obligatorias sobre las que se basa el examen final.

Por otra parte, se tratará la perspectiva de género en las tecnologías de la lengua, haciendo énfasis en aquellos aspectos técnicos que deben considerarse en las diferentes aplicaciones para evitar el sesgo de género.

La lengua de evaluación de la asignatura puede ser distinta de la lengua de impartición. 

 

 

Evaluación acreditativa de los aprendizajes

 

Evaluación continua

La modalidad de evaluación por defecto es la evaluación continua y se basa en las siguientes actividades:

— Un examen práctico (30 % de la nota final) que se lleva a cabo en noviembre.
— Un trabajo práctico (30 % de la nota final) que se entrega en la fecha prevista en el calendario de exámenes.
— Ejercicios teórico-prácticos (mínimo 3) que se trabajan al largo del curso en clase (40 % de la nota final).

Para poder aprobar la asignatura es necesario obtener una puntuación mínima de 4/10 puntos en cada actividad.

 

Evaluación única

En caso de que el estudiante no pueda seguir la evaluación continua, puede acogerse a la evaluación única, siempre que lo solicite en los términos y plazos establecidos por la Facultat.

La evaluación única consiste en un examen teórico y práctico a partes iguales (50 % cada una).


Reevaluación

En la prueba de reevaluación, que tendrá lugar en la fecha asignada por la Facultad, los estudiantes que hayan optado por la evaluación continuada podrán recuperar, del modo en que el professor considere conveniente, los exámenes, las pruebas o las actividades de evaluación que no hayan superado.

 

 

Fuentes de información básica

Consulta de la disponibilidad en el Cercabib

Libro

Clark, A., Ch. Fox, Sh. Lappin (2013)  The Handbook of Computational Linguistics and Natural Language Processing, Wiley-Blackwell. ISBN 978-1-118-34718-8.  Enllaç

Dale, R., Moisl, H., Somers, H. (Eds.) (2000) Handbook of Natural Language Processing, Nova York, Marcel Dekker.  Enllaç

Hovy, D. (2020). Text Analysis in Python for Social Scientists: Discovery and Exploration. Cambridge University Press.

https://www.cambridge.org/core/elements/text-analysis-in-python-for-social-scientists/BFAB0A3604C7E29F6198EA2F7941DFF3

Jurafsky D. & Martin, J. (2009) Speech and Language Processing, New Jersey (USA) Pearson Education.  Enllaç

Kübler, S., R.McDonald, J. Nivre (2009) Dependency Parsing. Synthesis Lectures on Human Language Technologies, Morgan & Claypool Publishers. ISBN: 978-1598295962.  Enllaç

M. A. Martí i M. Taulé (2014) Computational Hispanic Linguistics, a The Routledge Handbook of Hispanic Applied Linguistics, London and New York, Routledge.  Enllaç

Martí M. A. (coord.) (2000) Les tecnologies del llenguatge, Edicions de la Universitat Oberta de Catalunya, EDIUOC, pàg. 1- 272: versió en castellà publicada: Martí M. A. (coord.) (2003) Tecnologías del lenguaje, Barcelona, Editorial Universitat Oberta de Catalunya.  Enllaç

Martí M. A. i I. Castellón (2001) Lingüística Computacional, pàg.: 1-160. Barcelona, Edicions UB.  Enllaç

Martí M. A. y J. Llisterri (editores) (2004) Tecnologías del texto y del habla, Barcelona, Edicions UB. ISBN: 84-475-2647-X.  Enllaç

Martí M. A. y J. Llisterri (editores) (2002) Tratamiento del Lenguaje Natural, Barcelona, Edicions UB. ISBN: 84-475-2647-X.  Enllaç

Mitkov, R. (Ed.) (2003) The Oxford Handbook of Computational Linguistics, Oxford/Nova York, Oxford University Press.  Enllaç

Fonts d’informació complementàries:

Badia, T. (2000) Llengua catalana IV Tècniques de processament del llenguatge, a Martí (ed.) Barcelona, Edicions UOC.  Enllaç

Grishman, R. (1994), Computational Linguistics. An Introduction, Cambridge, Cambridge University Press.  Enllaç

Grishman, R. (1991),  Introducción a la lingüística computacional. Madrid, Visor.  Enllaç

McEnery and Wilson (1997) Corpus Linguistics, Edinburgh University Press.  Enllaç

Miller, G. (1990) "WordNet: An on-line lexical Database", a International Journal of Lexicography, vol 3. Oxford Univ. Press.  Enllaç

Rodríguez et. al (2001) Mètodes robustos per a l’anàlisi del llenguatge, a Martí (ed.) Lingüística Computacional. Barcelona, Ed. UOC.  Enllaç

Texto electrónico

Bird S., Klein E., Loper , E. (2009), Natural Language Processing: Analyzing Text with Python and the Natural Language Toolkit.  Enllaç

SpaCy: Industrial-Strength Natural Language Processing in Python.