Pla docent de l'assignatura

 

 

Tanca imatge de maquetació

 

Imprimeix

 

Dades generals

 

Nom de l'assignatura: BioinformÓtica Avanšada

Codi de l'assignatura: 568771

Curs acadŔmic: 2021-2022

Coordinaciˇ: Jose Francisco Abril Ferrando

Departament: Departament de GenŔtica, Microbiologia i EstadÝstica

crŔdits: 2,5

Programa ˙nic: S

 

 

Consideracions prŔvies

 

 

Conferències

Alguna conferència relacionada amb les eines bioinformàtiques i el desenvolupament pot complementar els ensenyaments més aplicats d’aquesta assignatura (alineament de seqüències, predicció de gens, assemblatge de genomes, cerca de regions promotores).

 

Altres professors

Professors del Departament de Genètica i diversos professors convidats especialistes en el tema.

 

Tutories

Els alumnes poden consultar al professor els dubtes o problemes que tinguin en relació amb l’assignatura, tant en les hores de consulta establertes com per correu electrònic. A més, es poden establir sessions de debat per aclarir els dubtes més comuns i/o per organitzar la feina dels projectes assignats als alumnes.

 

 

Hores estimades de dedicaciˇ

Hores totals 62.5

 

Activitats presencials i/o no presencials

16

 

-  Teoria

Presencial

 

16

Treball tutelat/dirigit

20

Aprenentatge aut˛nom

26.5

 

 

CompetŔncies que es desenvolupen

 

Competències bàsiques

  • Adquisició de coneixements que aportin una base o oportunitat de ser originals en el desenvolupament i/o aplicació d’idees, sovint en un context de recerca.
  • Capacitat d’aplicar els coneixements adquirits i de resoldre problemes en entorns nous o poc coneguts dins de contextos més amplis (o multidisciplinaris) relacionats amb l’àrea d’estudi.
  • Capacitat d’integrar coneixements i enfrontar-se a la complexitat de formular judicis a partir d’una informació que, tot i ser incompleta o limitada, inclogui reflexions sobre les responsabilitats socials i ètiques vinculades a l’aplicació dels coneixements i judicis.
  • Capacitat de comunicar les conclusions, i els coneixements i les raons últimes que les sustenten, a públics especialitzats i no especialitzats d’una manera clara i sense ambigüitats.
  • Habilitats d’aprenentatge que permetin continuar estudiant d’una forma que ha de ser en gran manera autodirigida o autònoma.


Competències generals
  • Capacitat per estructurar un discurs articulat de manera lògica i racional per discutir qualsevol aspecte científic davant d’una audiència heterogènia.
  • Capacitat de pensament crític, lògic i creatiu, i capacitat d’anàlisi i síntesi.
  • Capacitat d’interacció i transferència a l’entorn.
  • Capacitat de treball en grup i de col·laboració amb altres investigadors.
  • Capacitat per llegir i interpretar de manera crítica publicacions científiques relacionades amb el tema, i capacitat per dissenyar, escriure i defensar un projecte de recerca.


Competències específiques
  • Capacitat per planejar dissenys metodològics adequats per a l’avaluació de la diversitat genètica a partir del coneixement dels processos evolutius generadors d’aquesta diversitat.
  • Capacitat per processar i interpretar dades genòmiques procedents de l’anàlisi de l’expressió gènica i la seqüenciació massiva de genomes i, capacitat per familiaritzar-se amb les bases de dades i eines bioinformàtiques per accedir a les anotacions genòmiques disponibles.
  • Capacitat per aplicar els coneixements sobre l’origen i la funció de les cèl·lules mare durant la regeneració i reprogramació cel·lular per generar cèl·lules iPS i aplicar-les en medicina regenerativa.

 

 

 

 

Objectius d'aprenentatge

 

Referits a coneixements

L’objectiu principal de l’assignatura és ampliar els coneixements en bioinformàtica, en especial d’algunes de les eines més emprades. L’al·licient principal en aquest cas no és tan sols utilitzar eines bioinformàtiques que estiguin disponibles a través de formularis web o implementades pels alumnes, sinó entendre’n el funcionament. Els alineaments de dues o més seqüències, la cerca de similitud mitjançant els algorismes dels programes com ara el BLAST o els components principals que defineixen un programa de predicció de gens són alguns dels temes que es revisen en aquesta assignatura des del punt de vista més computacional. L’estudiant ha d’adquirir els coneixements i les capacitats necessàries per fer front a nous problemes bioinformàtics, fent servir els components algorísmics que li permetin trobar una solució òptima. Alhora, el fet d’entendre el funcionament intern d’alguns dels programes més emprats en bioinformàtica li ha de permetre treure més profit a nivell pràctic, com a usuari avançat, de les aplicacions treballades a l’assignatura, per exemple del BLAST.

Aquesta assignatura és bàsicament pràctica i entre els objectius aplicats podem esmentar els següents:

  • Proporcionar unes habilitats bàsiques per treballar des del sistema operatiu Unix i poder així automatitzar protocols.
  • Donar uns conceptes bàsics de programació perquè els alumnes puguin desenvolupar petits programes en Perl i Bash per processar i filtrar dades dintre dels seus protocols.
  • Mostrar les capacitats esteses d’algunes eines bioinformàtiques i opcions avançades.

 

 

Blocs temÓtics

 

1. La lÝnia de comandes Unix.

*  Introducció als sistemes operatius (Linux és Unix). La terminal de text i les interfícies gràfiques d’usuari. Execució de programes i l’arbre de processos. Estructura dels directoris i tipus de fitxers. Comandes bàsiques des de la terminal de Unix. Conceptes de reproducibilitat, reusabilitat i escalabilitat: la llibreta de laboratori computacional. Llenguatges de marques per enregistrar protocols bioinformàtics: MarkDown, sweave, jupiter notebooks, LaTeX.

2. Navegant per les dades.

*  Estructura de les dades, registres i camps. El codi ASCII i els editors de text: vi, emacs, geany, etc... Intèrpret de la línia de comandes. Comandes bàsiques de Unix. Canals d’entrada i sortida, redirecció de canals d’entrada/sortida cap a fitxers. Filtrant i editant dades amb comandes: sed, grep, awk. Comandes bàsiques amb eines bioinformàtiques des de la terminal.

3. Conceptes bÓsics de programaciˇ.

*  Llenguatges de programació: awk, perl, pyhton, R. Estructures de dades: variables, registres, referències. Entendre les referències. Estructures de control: iteracions i salts condicionals. Canals d’entrada/sortida. Expressions regulars per filtres avançats de dades. Anàlisi de dades i visualització amb l’intèrpret de comandes de R.

4. Conceptes de programaciˇ avanšada (adaptable en funciˇ del nivell inicial).

*  Funcions, modularització i reciclatge de codi. Modularitat i programació orientada a objectes: Mètodes i atributs d’un objecte, classes d’objectes i instàncies. Llibreries de programació per Bioinformàtica: BioPerl, BioPython, BioConductor.

5. Algorismes en BioinformÓtica

*  Algorismes i programes: cost asimptòtic, eficiència temporal i espacial, complexitat. Cerca de patrons, expressions regulars, arbres de sufixos. Principi d’optimalitat i algorismes de programació dinàmica. Indexat i mapat de seqüències, alineaments de seqüència, cerques de seqüències amb heurístics (BLAST).

6. SeqŘŔncies: assemblat de genomes i transcriptomes.

*  Processat de seqüències obtingudes per experiments de seqüenciació. Protocols bàsics d’assemblat: neteja d’adaptadors, filtres de qualitat, etapes de l’assemblat, validació de la completitud d’un assemblat. 

7. Anotaciˇ de seqŘŔncies: predicciˇ de gens.

*  Modelant elements d’anotació sobre seqüències: expressions regulars, matrius de pesos, models probabilístics. Modelant les estructures dels gens, classificació dels programes de predicció de gens i validació de la fiabilitat de les prediccions.

8. Altres protocols bioinformÓtics.

*  En funció dels experts que participin en el curs aquest tema pot estar més especialitzat i enfocat a la anotació funcional de gens i proteïnes, a la caracterització de variants genòmiques, a la predicció d’elements reguladors sobre el genoma, a la reconstrucció de xarxes gèniques, etc... 

 

 

Metodologia i activitats formatives

 

 

Ensenyament presencial

Consta de classes teoricopràctiques compostes per una introducció teòrica per establir el marc de treball de la part pràctica en la qual es treballen diferents eines i protocols bioinformàtics amb guions a desenvolupar amb l’ajut d’un ordinador. També pot incloure alguna conferència, impartida per professors convidats especialistes en el tema.

 

Ensenyament pràctic

El sistema operatiu Unix és la millor opció per dur a terme càlculs llargs i complexos, atesa l’estabilitat i les característiques per treballar en multitasca i multiusuari. Per aquesta raó la part més aplicada de l’assignatura té lloc majoritàriament amb Linux. Es fa servir el Perl com a llenguatge de programació, atesa l’aplicació en molts camps de la bioinformàtica i la flexibilitat de cara a processar fitxers amb els diferents formats que es troben per a les dades biològiques.

Cada pràctica es duu a terme seguint un protocol disponible via web, que inclou també els enllaços i els exemples corresponents. Per aquesta raó, les classes teoricopràctiques s’haurien d’impartir en aules d’informàtica amb ordinadors per a cada un o dos alumnes.

 

Ensenyament no presencial

L’alumne ha de llegir i ampliar la bibliografia i articles recomanats per assimilar els conceptes teòrics impartits a les classes. Així mateix, ha de presentar un petit projecte que li ha de permetre avaluar si ha assimilat els conceptes, tant en l’àmbit teòric com pràctic.

 

 

Avaluaciˇ acreditativa dels aprenentatges

 

 

Criteris i procediments d’avaluació

Es valora tant l’adquisició de coneixements teòrics com els pràctics; la capacitat de recollir i sintetitzar informació sobre un tema concret; la capacitat d’abstracció per abordar problemes bioinformàtics; la capacitat per escollir l’algorisme i/o el protocol més escaient per a un problema bioinformàtic en particular. En l’aspecte aplicat l’avaluació es basa en la capacitat d’abstraure els components elementals d’un problema per desenvolupar una solució lògica que es pugui implementar com a programa, fent servir un llenguatge de programació (en aquest cas el Perl), o bé utilitzar un protocol que faci servir programari específic per resoldre el problema.

En la primera sessió del curs es definiran els criteris específics de la avaluació. Els conceptes apresos, tant pràctics com teòrics, es posaran a prova mitjançant la realització de tres o quatre exercicis; aquests consistiran en la compleció d’un protocol específic d’anàlisi i en la discussió dels resultats obtinguts, on es valorarà també la integració de conceptes teòrics impartits a classe. Els coneixements adquirits podrien avaluar-se també mitjançant uns formularis web al final de cada sessió pràctica. Finalment, es tindrà en compte la participació i el nivell d’implicació dels alumnes al llarg de les sessions.

 

 

Fonts d'informaciˇ bÓsica

Consulteu la disponibilitat a CERCABIB

Llibre

Lesk, A.M.  Introduction to Bioinformatics. 4th ed. Oxford : Oxford University Press, 2014  Enlla├ž

Mount, D.W. 2004. Bioinformatics, Sequence and Genome Analysis. 2nd ed. New York : Cold Spring Harbor Laboratory Press, cop. 2004  Enlla├ž

Durbin, R; Eddy, S.R.; Krogh, A. and Mitchison, G. 1998. Biological Sequence Analysis : Probabilistic Models of Proteins and Nucleic Acids. First Edition. Cambridge University Press, Cambridge, UK.  Enlla├ž

Gusfield, D. 1997. Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. First Edition. Cambridge University Press, Cambridge, UK.  Enlla├ž

Baldi, P. and Brunak, S. 2001. Bioinformatics: The machine learning approach. Second Edition. The MIT Press, Cambridge, MA, US.  Enlla├ž

Korf, I.; Yandell, M. and Bedell, J. 2003. BLAST. First Edition. O’Reilly & Associates, Inc. Sebastopol, CA, US.  Enlla├ž

Majoros, W.H. 2007. Methods for Computational Gene Prediction. First Edition. Cambridge University Press, Cambridge, UK.  Enlla├ž

Gollery, M. 2008. Handbook of Hidden Markov Models in Bioinformatics. First Edition. CRC Press, New York, US.  Enlla├ž

Hall, B.G.  Phylogenetic Trees Made Easy. 4th ed. Sunderland, Mass. : Sinauer Associates, 2011  Enlla├ž

Claverie, J.M. and Notredame, C. 2007. Bioinformatics for Dummies. Second Edition. Wiley Publishing Inc, Indianapolis, IN, US.  Enlla├ž

Markel, S. and León, D. 2003. Sequence Analysis in a nutshell: A guide to common tools and databases. First Edition. O’Reilly & Associates, Inc. Sebastopol, CA, US.  Enlla├ž

Gibas, C. and Jambeck, P. 2001. Developing Bioinformatics Computer Skills. First Edition. O’Reilly & Associates, Inc. Sebastopol, CA, US.  Enlla├ž

Oakley, D.; Shadforth, I. and Bessant, C. Building Bioinformatics Solutions: With Perl, R and MySQL. 2nd ed. Oxford : Oxford University Press, 2014  Enlla├ž

Johnson, A.L. 2000. Elements of Programming with Perl. First Edition. Manning Publications Co. Greenwich, CT, US.  Enlla├ž

Tisdall, J. 2001. Beginning Perl for Bioinformatics. First Edition. O’Reilly & Associates, Inc. Sebastopol, CA, US.  Enlla├ž

Dwyer, R.A. 2003. Genomic Perl: From Bioinformatics Basics to Working Code. First Edition. Cambridge University Press, Cambridge, UK.  Enlla├ž

Tisdall, J. 2003. Mastering Perl for Bioinformatics. First Edition. O’Reilly & Associates, Inc. Sebastopol, CA, US.  Enlla├ž

CapÝtol

Abril, J.F. and Castellano, S. 2019. "Genome Annotation" Book chapter, pages 195–209.
In: Ranganathan S., Nakai K., Schönbach C., and Gribskov M. (eds). Encyclopedia of Bioinformatics and Computational Biology, vol 2. Elsevier Inc. ISBN: 978-0-12-811432-2