Pla docent de l'assignatura

 

 

Català English Tanca imatge de maquetació

 

Imprimeix

 

Dades generals

 

Nom de l'assignatura: Mètodes Estadístics en Mineria de Dades

Codi de l'assignatura: 361253

Curs acadèmic: 2021-2022

Coordinació: ARTURO PALOMINO GAYETE

Departament: Facultat d'Economia i Empresa

crèdits: 6

Programa únic: S

 

 

Hores estimades de dedicació

Hores totals 150

 

Activitats presencials i/o no presencials

60

 

-  Teoricopràctica

Presencial i no presencial

 

30

 

-  Pràctiques d'ordinadors

Presencial i no presencial

 

30

Treball tutelat/dirigit

40

Aprenentatge autònom

50

 

 

Recomanacions

 

— Cal tenir un esperit per a la resolució de problemes mitjançant la programació d’algorismes senzills.

— Cal tenir una bona base, sobretot, de les assignatures Anàlisi Multivariant i Models Lineals.

 

 

Competències que es desenvolupen

 

   -

Capacitat d'aprenentatge i responsabilitat (capacitat d'anàlisi, de síntesi, de visions globals i d'aplicació dels coneixements a la pràctica / capacitat de prendre decisions i d'adaptació a noves situacions).

   -

Treball en equip (capacitat de col·laborar amb els altres i de contribuir a un projecte comú / capacitat de col·laborar en equips interdisciplinaris i en equips multiculturals).

   -

Capacitat creativa i emprenedora (capacitat de formular, dissenyar i gestionar projectes / capacitat de cercar i integrar nous coneixements i actituds).

   -

Capacitat per usar els mètodes estadístics com a fonament de la presa de decisions en organitzacions de diferents àmbits professionals.

   -

Capacitat per seleccionar el mètode més adequat en la realització d'un estudi estadístic, d'avaluar les possibles alternatives i, si és procedent, incloure-hi l'anàlisi de costos i de recursos disponibles.

   -

Capacitat de proposar, modelitzar, analitzar, validar i interpretar situacions i problemes reals, adaptant els models teòrics a les necessitats específiques de les diferents àrees d'aplicació.

Objectius d'aprenentatge

 

Referits a coneixements

— Conèixer la tipologia dels principals problemes de la mineria de dades.

 

Referits a habilitats, destreses

— Avaluar la qualitat de les dades i la necessitat de preprocessar-les.

— Identificar les tècniques estadístiques i/o d’aprenentatge automàtic més apropiades al problema que s’ha de resoldre.

— Implementar algorismes senzills d’aprenentatge.

— Avaluar els resultats obtinguts.

— Presentar els resultats en un entorn professional per a la presa de decisions.

 

 

Blocs temàtics

 

1. Introducció a la mineria de dades

*  Tipus de problemes: problemes de modelització, problemes de ciència, problemes de transaccions i problemes de màrqueting

2. Visualització de les dades

*  Visualització de dades multivariants. Reducció de la dimensionalitat. Mètodes de selecció i extracció de variables

3. Clusterització (o clustering)

*  Mètodes de partició directa, jeràrquics i estadística matemàtica

4. Arbres de decisió

*  Arbres de classificació i regressió (CART)

5. Regles d’associació

*  Algorisme a priori

6. Regles de classificació. Anàlisi discriminada paramètrica

*  LDA, QDA i Naive Bayes

7. Mètodes flexibles de discriminació

*  Màquines de vectors suport

8. Xarxes neuronals

*  Discriminació pel perceptró multicapa

 

 

Metodologia i activitats formatives

 

La filosofia de la mineria de dades tracta de la conversió de dades en coneixement per a la presa de decisions, i com a tal constitueix la fase central del procés d’extracció de coneixement a partir de bases de dades. La mineria de dades és un punt de trobada de diferents disciplines: l’estadística, l’aprenentatge automàtic (machine learning), les tècniques de bases de dades i els sistemes per a la presa de decisions. Juntes permeten afrontar molts problemes actuals pel que fa al tractament de la informació.

L’assignatura introdueix les tècniques més usuals per a la resolució de tres tipus de problemes fonamentals: l’anàlisi de dades binàries («transaccions»), l’anàlisi de dades científiques (per exemple, de genòmica) i l’anàlisi de dades d’empreses; els quals configuren bona part dels problemes actuals que tracta la mineria de dades. Com a objectiu paral·lel hi ha utilitzar l’R, un potent entorn de programació lliure.

Les classes es divideixen, per tant, en la presentació de les eines estadístiques i d’aprenentatge, sempre a partir de l’exposició de casos reals i fent èmfasi en els conceptes implicats, les seves propietats, la interpretabilitat i l’aplicació de resultats; i en classes de laboratori, en què l’alumnat ha de posar en pràctica les experteses adquirides en la resolució de problemes.

Finalment, i atès que la finalitat de l’assignatura és la resolució de problemes reals, cada estudiant ha de resoldre un cas pràctic entre els casos posats a disposició lliurement o entre el problema cercat per l’estudiant amb el vistiplau del professorat.

 

 

Avaluació acreditativa dels aprenentatges

 

L’avaluació és comprensiva, en el sentit que avalua totes les competències específiques del curs, les destreses algorísmiques i la capacitat per enfrontar-se a problemes reals.

Hi ha dues notes: una nota obtinguda per examen, sobre els coneixements adquirits (T), i una altra obtinguda en un treball pràctic (P), que s’ha de presentar a final de curs.

La nota final s’obté de la ponderació següent:
Nota final = 0.5*T + 0.5*P

A més, es valoren les intervencions a classe, que permeten pujar la nota fins a un 10 %.

En cas que l’estudiant no superi l’avaluació continuada, sempre té dret a presentar-se a l’examen extraordinari (de repesca) del mes de febrer amb les mateixes condicions que a l’avaluació única.

 

Avaluació única

L’estudiant té dret, en qualsevol cas, a presentar-se a l’examen final de l’assignatura per obtenir una avaluació única i final. Aquesta avaluació consta d’un examen final, més el lliurament d’un treball pràctic equivalent al dut a terme en l’avaluació continuada.

En cas que l’estudiant no superi la prova d’avaluació única, sempre té dret a presentar-se a l’examen extraordinari (de repesca) del mes de febrer, amb les mateixes condicions que a l’avaluació única.

 

 

Fonts d'informació bàsica

Consulteu la disponibilitat a CERCABIB

Llibre

ALUJA, Tomàs, et al. Aprender de los datos: el análisis de componentes principales: una aproximación desde el Data Mining. Barcelona: EUB, 1999

Catàleg UB  Enllaç

HAND, D. J. Construction and assessment of classification rules. Chichester [etc.]: Wiley, 1997

Catàleg UB  Enllaç

HASTIE, Trevor, et al. The Elements of statistical learning. New York: Springer, 2001

Catàleg UB  Enllaç
Versió en línia: Accés directe restringit als usuaris de la UB  Enllaç

HERNÁNDEZ, José, et al. Introducción a la minería de datos. Madrid: Pearson, 2004

Catàleg UB  Enllaç

WITTEN, I. H., et al. Data mining: practical machine learning tools and techniques with java implementations. San Francisco [Calif.] [etc.]: Morgan Kaufmann, 2002

Catàleg UB (ed. 2000)  Enllaç
Catàleg UB (3rd ed., 2011)  Enllaç