Dades generals |
Nom de l'assignatura: Tècniques Estadístiques d'Anàlisi de Dades
Codi de l'assignatura: 568353
Curs acadèmic: 2021-2022
Coordinació: Francesc Oliva Cuyas
Departament: Departament de Genètica, Microbiologia i Estadística
crèdits: 6
Programa únic: S
Hores estimades de dedicació |
Hores totals 150 |
Activitats presencials i/o no presencials |
60 |
- Pràctiques de laboratori |
Presencial |
60 |
Treball tutelat/dirigit |
40 |
Aprenentatge autònom |
50 |
Competències que es desenvolupen |
|
Objectius d'aprenentatge |
Referits a coneixements • Proporcionar els fonaments bàsics i com cal aplicar algunes de les eines d’estadística univariant i multivariant més habitualment emprades en l’anàlisi de dades en ecologia i gestió del medi natural.
|
Blocs temàtics |
1. Introducció general a l’assignatura i als diferents programaris estadístics utilitzats
* Introducció conceptual a l’assignatura. Presentació i justificació del programari emprat. El programari PRIMER/PERMANOVA+. El mòdul Ginkgo de VegAna. R Project: introducció al llenguatge i a l’R Studio, gestió de dades i alguns primers càlculs
2. El model lineal i el disseny d’experiments
* El model lineal general. Regressió lineal simple i múltiple. Diagnòstics de regressió. Introducció al disseny d’experiments. ANOVA i ANCOVA. Presentació i resolució de casos amb R
3. El model lineal generalitzat
* Introducció al model lineal generalitzat. Diagnòstics, avaluació de l’ajust i selecció de models. Regressió logística i Poisson. Presentació i resolució de casos amb R
4. Models lineals mixtos
* Fonaments dels models lineals mixtos: què són i quan cal usar-los. Models mixtos amb variables categòriques. Models mixtos amb variables contínues. Presentació i resolució de casos amb R
5. Introducció a les tècniques d’anàlisi multivariant de dades
* Matrius de dades, vector de mitjanes, matriu de covariàncies i matriu de correlacions. Distàncies i similituds. Transformacions de variables i mesures de distàncies i similituds recomanables en l’anàlisi de dades en ecologia. Tècniques de representació, tècniques de classificació i tècniques d’inferència estadística
6. Inferència multivariant: MANOVA i PERMANOVA
* MANOVA (Multivariate Analysis of Variance). El problema de la no-normalitat de les dades i utilització de tests basats en permutacions: PERMANOVA. Presentació i resolució de casos pràctics.
7. L’anàlisi de components principals
* Introducció a la tècnica i objectius. Elecció del nombre de components i interpretació. Rotació varimax. Relació amb l’anàlisi factorial. Presentació i resolució de casos pràctics amb R.
8. Escalat multidimensional mètric i no mètric (multidimensional scaling)
* Funcions de proximitat entre objectes. Reducció de la dimensió mitjançant una matriu de proximitats. MDS mètric i no mètric.Presentació i resolució de casos pràctics amb R.
9. Introducció a les eines d’anàlisi de conglomerats (cluster analysis)
* Anàlisi de conglomerat jeràrquic: dendrogrames. Mètodes no jeràrquics: k-mitjanes i Fuzzy c-means. Estratègies per elegir el nombre de clústers. Presentació i resolució de casos pràctics amb Ginkgo i R
10. L’anàlisi discriminant
* Construcció i avaluació d’una regla discriminant. El discriminador lineal de Fisher o discriminador canònic. Selecció de variables. Un mètode d’anàlisi discriminant basat en distàncies. Presentació i resolució de casos pràctics amb Ginkgo i R
11. Algunes tècniques d’anàlisi canònica
* Relació i projeccions a l’espai entre dues matrius de dades: expliquen les variables «ambientals» la presència i/o abundància de les espècies? Anàlisi de redundància (RDA) i anàlisi canònica de correspondències (CCA). Generalització per a qualsevol tipus de distància entre els sites d’espècies: dbRDA (Distance Based Redundancy Analysis). Presentació i resolució de casos pràctics amb PRIMER / PERMANOVA i R.
12. Casos pràctics finals
* • Presentació de casos que han de permetre als estudiants el plantejament i la utilització de diverses tècniques treballades en el curs, tan de la part d’univariant com de multivariant.
** El temari i continguts presentats són els previstos en el desenvolupament de l’assignatura, llevat que les restriccions imposades pel govern i/o les autoritats sanitàries obliguin a una priorització o reducció d’aquests continguts, així com de la presencialitat.
Metodologia i activitats formatives |
Classes presencials realitzades íntegrament a l’aula d’informàtica. Presentació de casos que permetin integrar els conceptes i les tècniques presentades. Es proposaran casos pràctics que hauran de resoldre els estudiants amb el programari adequat, amb el seguiment i la tutorització del professor/a. Especial èmfasi en la metodologia, les condicions d’aplicabilitat de les tècniques i la seva interpretació, sense aprofundir més enllà de lo estrictament necessari en la part més teòrica de les eines utilitzades.
|
Avaluació acreditativa dels aprenentatges |
• 60% Avaluació continuada: 2 proves presencials (30% cada prova) realitzades en el decurs del desenvolupament de l’assignatura. Cada prova tindrà dos blocs: univariant i multivariant. En el cas que l’estudiant hagi superat cadascuna de les proves i blocs amb un mínim de 4,0 (puntuació mínima per a cadascun dels quatre blocs, és a dir, els dos d’univariant i els dos de multivariant) pot optar a no presentar-se a la prova de síntesi final; en el cas que així ho decideixi, la seva qualificació final serà la mitjana aritmètica de les dues proves d’avaluació continuada.
|
Fonts d'informació bàsica |
Consulteu la disponibilitat a CERCABIB
Llibre
Crawley, M.J. The R Book. Chichester : Wiley & Sons, 2007
Shaw, P.A. Multivariate Statistics for the Environmental Science. Wiley, 2 ed. (2003).
Zuur, Alain F., Ieno, Elena N., Smith, Graham M. Analysing Ecological Data. Springer, 2007.