Pla docent de l'assignatura

 

 

Català Castellano English Tanca imatge de maquetació

 

Imprimeix

 

Dades generals

 

Nom de l'assignatura: Lingüística Computacional

Codi de l'assignatura: 361749

Curs acadèmic: 2024-2025

Coordinació: Itziar Aduriz Agirre

Departament: Departament de Filologia Catalana i Lingüística General

Crèdits: 6

Programa únic: S

 

 

Hores estimades de dedicació

Hores totals 150

 

Activitats presencials i/o no presencials

46

 

-  Teoricopràctica

Presencial

 

46

Treball tutelat/dirigit

50

Aprenentatge autònom

54

 

 

Recomanacions

 

— Convé haver cursat prèviament les assignatures de Morfologia, Sintaxi i Tecnologies de la Informació i la Comunicació.
— L’assignatura s’imparteix en català.

 

 

Competències / Resultats d'aprenentatge que es desenvolupen

 

   -

Habilitat en la utilització de recursos informàtics, tècnics i audiovisuals.

   -

Capacitat per aplicar els coneixements lingüístics adquirits en l'entorn social, laboral i personal.

   -

Habilitats de gestió de la informació (habilitat per cercar i analitzar informació provinent de fonts diverses).

   -

Plantejament i resolució de problemes metodològics i conceptuals de manera autònoma i en equip.

   -

Habilitats en la formalització lingüística.

   -

Coneixements i habilitats en tecnologies del llenguatge.

Objectius d'aprenentatge

 

Referits a coneixements

— Analitzar la problemàtica que presenta el processament del llenguatge natural (PLN) en l’àmbit morfològic, sintàctic, lèxic i semàntic.

— Conèixer les diferents aplicacions de la lingüística computacional.

— Veure com s’estructura la informació lingüística en els diferents mòduls d’aquestes aplicacions.

— Conèixer les tècniques i els mètodes més comuns d’anàlisi morfològica, sintàctica i semàntica.

 

Referits a habilitats, destreses

— Adquirir habilitats tant en l’ús d’eines i recursos informàtics per a l’anàlisi automàtica del llenguatge com en la formalització lingüística, indispensable en qualsevol proposta teòrica i per a l’anàlisi descriptiva i/o computacional.

 

 

Blocs temàtics

 

1. Què entenem per processament del llenguatge natural (PLN)? Quins objectius té?

1.1. Àrees de recerca

1.2. Mòduls estàndard en els sistemes de PLN

1.3. Recursos lingüístics

1.4. L’ambigüitat del llenguatge: el gran repte del PLN

2. Tècniques, mètodes i recursos associats a l’anàlisi automàtica del llenguatge

2.1. Mètodes empírics i mètodes basats en coneixement

2.2. Tècniques, processos i recursos d’anàlisi morfològica

2.3. Tècniques, processos i recursos d’anàlisi sintàctica

2.4. Tècniques, processos i recursos d’anàlisi semàntica

3. Aplicacions del PLN

3.1. Traducció automàtica

3.2. Extracció d’informació: classificació de documents i resum automàtic

3.3. Recuperació d’informació i cerca de respostes

3.4. Anàlisi de sentiments i mineria d’opinions

3.5. Tecnologies de la parla

 

 

Metodologia i activitats formatives

 

Per entendre la necessitat de formalització, implícita en una disciplina com és la lingüística computacional i sense la qual és impossible dur a terme el processament del llenguatge natural, es combinen amb un pes idèntic classes teòriques i classes pràctiques, relacionades aquestes últimes amb la matèria que s’imparteix en cada moment. Així mateix, les classes teòriques es complementen amb unes lectures obligatòries, sobre les quals es basa l’examen final. D’altra banda, es prendrà en consideració la perspectiva de gènere en el contingut de l’assignatura: es tractarà la perspectiva de gènere en les tecnologies de la llengua, fent èmfasi en aquells aspectes tècnics que s’han de considerar en les diferents aplicacions per evitar el biaix de gènere.

La llengua d’avaluació de l’assignatura pot ser diferent de la llengua d’impartició. 

 

 

Avaluació acreditativa dels aprenentatges

 

Avaluació continuada

La modalitat d’avaluació per defecte és l’avaluació continuada i es basa en les activitats següents:


— Un examen pràctic (30 % de la nota final) que es duu a terme cap al novembre.
— Un treball pràctic (30 % de la nota final) que es lliura en la data prevista en el calendari d’exàmens.
— Exercicis teoricopràctics (mínim 3) que es treballen al llarg del curs a classe (40 % de la nota final).

Per poder aprovar l’assignatura és necessari obtenir una puntuació mínima de 4/10 punts en cada activitat.

 

Avaluació única

En cas que l’estudiant no pugui seguir l’avaluació continuada, pot acollir-se a l’avaluació única, sempre que ho sol·liciti en els termes i terminis establerts per la Facultat.

L’avaluació única consisteix en un examen teòric i pràctic a parts iguals (50 % cadascuna).


Reavaluació

En la prova de reavaluació, que es farà en la data assignada per la Facultat, els estudiants que hagin optat per l’avaluació continuada podran recuperar, de la manera que el professor consideri convenient, els exàmens, les proves o les activitats d’avaluació que no hagin superat.

 

 

Fonts d'informació bàsica

Consulta de la disponibilitat al Cercabib

Llibre

Clark, A., Ch. Fox, Sh. Lappin (2013)  The Handbook of Computational Linguistics and Natural Language Processing, Wiley-Blackwell. ISBN 978-1-118-34718-8.  Enllaç

Dale, R., Moisl, H., Somers, H. (Eds.) (2000) Handbook of Natural Language Processing, Nova York, Marcel Dekker.  Enllaç

Hovy, D. (2020). Text Analysis in Python for Social Scientists: Discovery and Exploration. Cambridge University Press.

https://www.cambridge.org/core/elements/text-analysis-in-python-for-social-scientists/BFAB0A3604C7E29F6198EA2F7941DFF3

Jurafsky D. & Martin, J. (2009) Speech and Language Processing, New Jersey (USA) Pearson Education.  Enllaç

Kübler, S., R.McDonald, J. Nivre (2009) Dependency Parsing. Synthesis Lectures on Human Language Technologies, Morgan & Claypool Publishers. ISBN: 978-1598295962.  Enllaç

M. A. Martí i M. Taulé (2014) Computational Hispanic Linguistics, a The Routledge Handbook of Hispanic Applied Linguistics, London and New York, Routledge.  Enllaç

Martí M. A. (coord.) (2000) Les tecnologies del llenguatge, Edicions de la Universitat Oberta de Catalunya, EDIUOC, pàg. 1- 272: versió en castellà publicada: Martí M. A. (coord.) (2003) Tecnologías del lenguaje, Barcelona, Editorial Universitat Oberta de Catalunya.  Enllaç

Martí M. A. i I. Castellón (2001) Lingüística Computacional, pàg.: 1-160. Barcelona, Edicions UB.  Enllaç

Martí M. A. y J. Llisterri (editores) (2004) Tecnologías del texto y del habla, Barcelona, Edicions UB. ISBN: 84-475-2647-X.  Enllaç

Martí M. A. y J. Llisterri (editores) (2002) Tratamiento del Lenguaje Natural, Barcelona, Edicions UB. ISBN: 84-475-2647-X.  Enllaç

Mitkov, R. (Ed.) (2003) The Oxford Handbook of Computational Linguistics, Oxford/Nova York, Oxford University Press.  Enllaç

Fonts d’informació complementàries:

Badia, T. (2000) Llengua catalana IV Tècniques de processament del llenguatge, a Martí (ed.) Barcelona, Edicions UOC.  Enllaç

Grishman, R. (1994), Computational Linguistics. An Introduction, Cambridge, Cambridge University Press.  Enllaç

Grishman, R. (1991),  Introducción a la lingüística computacional. Madrid, Visor.  Enllaç

McEnery and Wilson (1997) Corpus Linguistics, Edinburgh University Press.  Enllaç

Miller, G. (1990) "WordNet: An on-line lexical Database", a International Journal of Lexicography, vol 3. Oxford Univ. Press.  Enllaç

Rodríguez et. al (2001) Mètodes robustos per a l’anàlisi del llenguatge, a Martí (ed.) Lingüística Computacional. Barcelona, Ed. UOC.  Enllaç

Text electrònic

Bird S., Klein E., Loper , E. (2009), Natural Language Processing: Analyzing Text with Python and the Natural Language Toolkit.  Enllaç

SpaCy: Industrial-Strength Natural Language Processing in Python.