|
Dades generals |
Nom de l'assignatura: Lingüística Computacional
Codi de l'assignatura: 361749
Curs acadèmic: 2024-2025
Coordinació: Itziar Aduriz Agirre
Departament: Departament de Filologia Catalana i Lingüística General
Crèdits: 6
Programa únic: S
|
Hores estimades de dedicació |
Hores totals 150 |
|
Activitats presencials i/o no presencials |
46 |
|
- Teoricopràctica |
Presencial |
46 |
|||
|
Treball tutelat/dirigit |
50 |
|
Aprenentatge autònom |
54 |
|
Recomanacions |
|
— Convé haver cursat prèviament les assignatures de Morfologia, Sintaxi i Tecnologies de la Informació i la Comunicació. |
|
Competències / Resultats d'aprenentatge que es desenvolupen |
| - |
Habilitat en la utilització de recursos informàtics, tècnics i audiovisuals. |
| - |
Capacitat per aplicar els coneixements lingüístics adquirits en l'entorn social, laboral i personal. |
| - |
Habilitats de gestió de la informació (habilitat per cercar i analitzar informació provinent de fonts diverses). |
| - |
Plantejament i resolució de problemes metodològics i conceptuals de manera autònoma i en equip. |
| - |
Habilitats en la formalització lingüística. |
| - |
Coneixements i habilitats en tecnologies del llenguatge. |
|
Objectius d'aprenentatge |
|
Referits a coneixements — Analitzar la problemàtica que presenta el processament del llenguatge natural (PLN) en l’àmbit morfològic, sintàctic, lèxic i semàntic.
Referits a habilitats, destreses — Adquirir habilitats tant en l’ús d’eines i recursos informàtics per a l’anàlisi automàtica del llenguatge com en la formalització lingüística, indispensable en qualsevol proposta teòrica i per a l’anàlisi descriptiva i/o computacional. |
|
Blocs temàtics |
1. Què entenem per processament del llenguatge natural (PLN)? Quins objectius té?
1.1. Àrees de recerca
1.2. Mòduls estàndard en els sistemes de PLN
1.3. Recursos lingüístics
1.4. L’ambigüitat del llenguatge: el gran repte del PLN
2. Tècniques, mètodes i recursos associats a l’anàlisi automàtica del llenguatge
2.1. Mètodes empírics i mètodes basats en coneixement
2.2. Tècniques, processos i recursos d’anàlisi morfològica
2.3. Tècniques, processos i recursos d’anàlisi sintàctica
2.4. Tècniques, processos i recursos d’anàlisi semàntica
3. Aplicacions del PLN
3.1. Traducció automàtica
3.2. Extracció d’informació: classificació de documents i resum automàtic
3.3. Recuperació d’informació i cerca de respostes
3.4. Anàlisi de sentiments i mineria d’opinions
3.5. Tecnologies de la parla
|
Metodologia i activitats formatives |
|
Per entendre la necessitat de formalització, implícita en una disciplina com és la lingüística computacional i sense la qual és impossible dur a terme el processament del llenguatge natural, es combinen amb un pes idèntic classes teòriques i classes pràctiques, relacionades aquestes últimes amb la matèria que s’imparteix en cada moment. Així mateix, les classes teòriques es complementen amb unes lectures obligatòries, sobre les quals es basa l’examen final. D’altra banda, es prendrà en consideració la perspectiva de gènere en el contingut de l’assignatura: es tractarà la perspectiva de gènere en les tecnologies de la llengua, fent èmfasi en aquells aspectes tècnics que s’han de considerar en les diferents aplicacions per evitar el biaix de gènere.
|
|
Avaluació acreditativa dels aprenentatges |
|
Avaluació continuada
Avaluació única En cas que l’estudiant no pugui seguir l’avaluació continuada, pot acollir-se a l’avaluació única, sempre que ho sol·liciti en els termes i terminis establerts per la Facultat.
|
|
Fonts d'informació bàsica |
Consulta de la disponibilitat al Cercabib
Llibre
Hovy, D. (2020). Text Analysis in Python for Social Scientists: Discovery and Exploration. Cambridge University Press.
Jurafsky D. & Martin, J. (2009) Speech and Language Processing, New Jersey (USA) Pearson Education. ![]()
Martí M. A. i I. Castellón (2001) Lingüística Computacional, pàg.: 1-160. Barcelona, Edicions UB. ![]()
Fonts d’informació complementàries:
Grishman, R. (1991), Introducción a la lingüística computacional. Madrid, Visor. ![]()
McEnery and Wilson (1997) Corpus Linguistics, Edinburgh University Press. ![]()
Text electrònic
SpaCy: Industrial-Strength Natural Language Processing in Python.