Pla docent de l'assignatura

 

 

Tanca imatge de maquetació

 

Imprimeix

 

Dades generals

 

Nom de l'assignatura: Lingüística Computacional

Codi de l'assignatura: 361749

Curs acadèmic: 2021-2022

Coordinació: Itziar Aduriz Agirre

Departament: Departament de Filologia Catalana i Lingüística General

crèdits: 6

Programa únic: S

 

 

Hores estimades de dedicació

Hores totals 150

 

Activitats presencials i/o no presencials

52

 

-  Teoricopràctica

Presencial i no presencial

 

52

Treball tutelat/dirigit

48

Aprenentatge autònom

50

 

 

Recomanacions

 

— Convé haver cursat prèviament les assignatures de Morfologia, Sintaxi i Tecnologies de la Informació i la Comunicació.
— L’assignatura s’imparteix en català.

 

 

Competències que es desenvolupen

 

   -

Habilitat en la utilització de recursos informàtics, tècnics i audiovisuals.

   -

Capacitat per aplicar els coneixements lingüístics adquirits en l'entorn social, laboral i personal.

   -

Habilitats de gestió de la informació (habilitat per cercar i analitzar informació provinent de fonts diverses).

   -

Plantejament i resolució de problemes metodològics i conceptuals de manera autònoma i en equip.

   -

Habilitats en la formalització lingüística.

   -

Coneixements i habilitats en tecnologies del llenguatge.

Objectius d'aprenentatge

 

Referits a coneixements

— Analitzar la problemàtica que presenta el processament del llenguatge natural (PLN) en l’àmbit morfològic, sintàctic, lèxic i semàntic.

— Conèixer les diferents aplicacions de la lingüística computacional.

— Veure com s’estructura la informació lingüística en els diferents mòduls d’aquestes aplicacions.

— Conèixer les tècniques i els mètodes més comuns d’anàlisi morfològica, sintàctica i semàntica.

 

Referits a habilitats, destreses

— Adquirir habilitats tant en l’ús d’eines i recursos informàtics per a l’anàlisi automàtica del llenguatge com en la formalització lingüística, indispensable en qualsevol proposta teòrica i per a l’anàlisi descriptiva i/o computacional.

 

 

Blocs temàtics

 

1. Què entenem per processament del llenguatge natural (PLN)? Quins objectius té?

1.1. Àrees de recerca

1.2. Mòduls estàndard en els sistemes de PLN

1.3. Recursos lingüístics

1.4. L’ambigüitat del llenguatge: el gran repte del PLN

2. Tècniques, mètodes i recursos associats a l’anàlisi automàtica del llenguatge

2.1. Mètodes empírics i mètodes basats en coneixement

2.2. Tècniques, processos i recursos d’anàlisi morfològica

2.3. Tècniques, processos i recursos d’anàlisi sintàctica

2.4. Tècniques, processos i recursos d’anàlisi semàntica

3. Aplicacions del PLN

3.1. Traducció automàtica

3.2. Extracció d’informació: classificació de documents i resum automàtic

3.3. Recuperació d’informació i cerca de respostes

3.4. Anàlisi de sentiments i mineria d’opinions

3.5. Tecnologies de la parla

 

 

Metodologia i activitats formatives

 

Per entendre la necessitat de formalització, implícita en una disciplina com és la lingüística computacional i sense la qual és impossible dur a terme el processament del llenguatge natural, es combinen amb un pes idèntic classes teòriques i classes pràctiques, relacionades aquestes últimes amb la matèria que s’imparteix en cada moment. Així mateix, les classes teòriques es complementen amb unes lectures obligatòries, sobre les quals es basa l’examen final. D’altra banda, es tractarà la perspectiva de gènere en les tecnologies de la llengua, fent èmfasi en aquells aspectes tècnics que s’han de considerar en les diferents aplicacions per a evitar el biaix de gènere.

 

 

Avaluació acreditativa dels aprenentatges

 

Avaluació continuada

La modalitat d’avaluació per defecte és l’avaluació continuada i es basa en les activitats següents:
— Un examen pràctic (30 % de la nota final), que es duu a terme a principis de desembre.
— Un examen teòric (50 %), que es duu a terme en la data prevista en el calendari d’exàmens de la Facultat.
— Un treball pràctic (20 %), que s’elabora al llarg del curs a classe i es lliura a mitjans de novembre.

Per poder aprovar l’assignatura és necessari presentar-se als dos exàmens, entregar el treball i obtenir una puntuació mínima de 4/10 punts en cada activitat.

 

Avaluació única

En cas que l’estudiant no pugui seguir l’avaluació continuada, pot acollir-se a l’avaluació única, sempre que ho sol·liciti en els termes i terminis establerts per la Facultat.

L’avaluació única consisteix en un examen teòric (60 % de la nota final) i un examen pràctic (40 %).


Reavaluació

Només cal examinar-se de les activitats que no s’hagin aprovat en la convocatòria ordinària.

 

 

Fonts d'informació bàsica

Consulteu la disponibilitat a CERCABIB

Llibre

Clark, A., Ch. Fox, Sh. Lappin (2013)  The Handbook of Computational Linguistics and Natural Language Processing, Wiley-Blackwell. ISBN 978-1-118-34718-8.  Enllaç

Dale, R., Moisl, H., Somers, H. (Eds.) (2000) Handbook of Natural Language Processing, Nova York, Marcel Dekker.  Enllaç

Hovy, D. (2020). Text Analysis in Python for Social Scientists: Discovery and Exploration. Cambridge University Press.

https://www.cambridge.org/core/elements/text-analysis-in-python-for-social-scientists/BFAB0A3604C7E29F6198EA2F7941DFF3

Jurafsky D. & Martin, J. (2009) Speech and Language Processing, New Jersey (USA) Pearson Education.  Enllaç

Kübler, S., R.McDonald, J. Nivre (2009) Dependency Parsing. Synthesis Lectures on Human Language Technologies, Morgan & Claypool Publishers. ISBN: 978-1598295962.  Enllaç

M. A. Martí i M. Taulé (2014) Computational Hispanic Linguistics, a The Routledge Handbook of Hispanic Applied Linguistics, London and New York, Routledge.  Enllaç

Martí M. A. (coord.) (2000) Les tecnologies del llenguatge, Edicions de la Universitat Oberta de Catalunya, EDIUOC, pàg. 1- 272: versió en castellà publicada: Martí M. A. (coord.) (2003) Tecnologías del lenguaje, Barcelona, Editorial Universitat Oberta de Catalunya.  Enllaç

Martí M. A. i I. Castellón (2001) Lingüística Computacional, pàg.: 1-160. Barcelona, Edicions UB.  Enllaç

Martí M. A. y J. Llisterri (editores) (2004) Tecnologías del texto y del habla, Barcelona, Edicions UB. ISBN: 84-475-2647-X.  Enllaç

Martí M. A. y J. Llisterri (editores) (2002) Tratamiento del Lenguaje Natural, Barcelona, Edicions UB. ISBN: 84-475-2647-X.  Enllaç

Mitkov, R. (Ed.) (2003) The Oxford Handbook of Computational Linguistics, Oxford/Nova York, Oxford University Press.  Enllaç

Fonts d’informació complementàries:

Badia, T. (2000) Llengua catalana IV Tècniques de processament del llenguatge, a Martí (ed.) Barcelona, Edicions UOC.  Enllaç

Grishman, R. (1994), Computational Linguistics. An Introduction, Cambridge, Cambridge University Press.  Enllaç

Grishman, R. (1991),  Introducción a la lingüística computacional. Madrid, Visor.  Enllaç

McEnery and Wilson (1997) Corpus Linguistics, Edinburgh University Press.  Enllaç

Miller, G. (1990) "WordNet: An on-line lexical Database", a International Journal of Lexicography, vol 3. Oxford Univ. Press.  Enllaç

Rodríguez et. al (2001) Mètodes robustos per a l’anàlisi del llenguatge, a Martí (ed.) Lingüística Computacional. Barcelona, Ed. UOC.  Enllaç

Text electrònic

Bird S., Klein E., Loper , E. (2009), Natural Language Processing: Analyzing Text with Python and the Natural Language Toolkit.  Enllaç

SpaCy: Industrial-Strength Natural Language Processing in Python.