Pla docent de l'assignatura

 

 

Tanca imatge de maquetació

 

Imprimeix

 

Dades generals

 

Nom de l'assignatura: Dades Massives

Codi de l'assignatura: 365850

Curs acadŔmic: 2021-2022

Coordinaciˇ: Angel Borrego Huerta

Departament: Departament de Biblioteconomia, Documentaciˇ i Comunicaciˇ Audiovisual

crŔdits: 3

Programa ˙nic: S

 

 

Hores estimades de dedicaciˇ

Hores totals 75

 

Activitats presencials i/o no presencials

25

 

-  TeoricoprÓctica

Presencial

 

10

 

-  PrÓctiques d'ordinadors

Presencial

 

15

Treball tutelat/dirigit

25

Aprenentatge aut˛nom

25

 

 

CompetŔncies que es desenvolupen

 

   -

Capacitat comunicativa (capacitat de comprendre i d'expressar-se oralment i per escrit en catalÓ, castellÓ i una tercera llengua, amb domini del llenguatge especialitzat / capacitat de cercar, usar i integrar la informaciˇ).

   -

Capacitat d'analitzar i interpretar les demandes i expectatives dels usuaris i els clients, actuals i potencials, i resoldre-les; orientar-los i proporcionar-los formaciˇ i materials d'ajuda en l'˙s i explotaciˇ de fonts, recursos i sistemes d'informaciˇ.

   -

Capacitat d'analitzar l'entorn de les unitats i els serveis d'informaciˇ, les necessitats dels usuaris i les habilitats en l'obtenciˇ i la interpretaciˇ de dades sobre els processos de generaciˇ, de transferŔncia i d'˙s de la informaciˇ.

Blocs temÓtics

 

1. Introducciˇ: ciŔncia de dades i R

2. Valor informatiu de les variables

3. Arbres de decisiˇ

4. Classificadors bayesians

5. Regressiˇ

6. Clustering

7. Extracciˇ d’informaciˇ del web (web scraping) i d’APIs

8. GrÓfics, animacions i mapes

 

 

Metodologia i activitats formatives

 

L’assignatura té una orientació eminentment pràctica. L’explicació dels principals algoritmes de ciència de dades, les tècniques d’extracció de dades del web i la creació de visualitzacions es complementen amb exercicis pràctics amb el programa R.

 

 

Avaluaciˇ acreditativa dels aprenentatges

 

L’avaluació continuada consta de dos elements:

  • Lliurament d’un seguit d’exercicis a realitzar durant el curs (60 %). No reavaluables.
  • Un examen escrit (40 %). Reavaluable a partir d’una nota igual o superior a 4.

 

Avaluaciˇ ˙nica

La sol·licitud per acollir-se a l’avaluació única s’ha de lliurar a la secretaria del centre durant els vint primers dies naturals des de l’inici del semestre o durant els vint primers dies naturals a comptar de la data en què s’hagi fet efectiva la matrícula o l’ampliació, si és posterior a l’inici del semestre.

L’avaluació única consta de dos elements:

  • Un treball d’anàlisi de dades amb el programa R (60 %). No reavaluable.

  • Un examen escrit (40 %). Reavaluable a partir d’una nota igual o superior a 4.


Aquest sistema d’avaluació pot patir modificacions en funció de l’evolució de la situació d’excepcionalitat provocada per la COVID-19.

 

 

Fonts d'informaciˇ bÓsica

Consulteu la disponibilitat a CERCABIB

Llibre

Shah, Chirag. (2020). A hands-on introduction to data science. Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108560412.

https://cercabib.ub.edu/discovery/search?vid=34CSUC_UB:VU1&search_scope=MyInst_and_CI&query=any,contains,b2743719*  Enlla├ž

Spiegelhalter, David. (2019). The art of statistics: how to learn from data. New York: Basic Books

Enllaš al catÓleg de la biblioteca  Enlla├ž

Bramer, Max. (2020). Principles of data mining. 4th ed. London: Springer. http://doi.org/10.1007/978-1-4471-7493-6

Enllaš al catÓleg de la biblioteca  Enlla├ž

PÓgina web

Serrano, Luis. (2020). Serrano academy: Artificial intelligence and math made easy. https://serrano.academy

Text electr˛nic

Douglas, Alex; Roos, Deon; Mancini, Francesca; Couto, Ana; Lusseau, David. (2021). An introduction to R. https://intro2r.com