Vue générale du cours
Cet ouvrage est le premier d’une série de trois volumes traitant de la science des données biologiques. L’écriture de cette suite de livres a débuté au cours de l’année académique 2018-2019. Pour l’année académique 2021-2022, ceci est le support des cours suivants :
Science des données I : visualisation et inférence au second Bachelier en Biologie en Faculté des Sciences de l’Université de Mons, et dont le responsable est Philippe Grosjean
Bio-informatique et sciences des données au second Bachelier en Biologie en Faculté des Sciences à Charleroi en co-diplomation entre l’Université de Mons (UMONS) et l’Université Libre de Bruxelles (ULB), et dont le responsable est Raphaël Conotte
La matière est divisée en 12 modules représentant chacun 6h de travail en présentiel. Chaque module nécessitera environ 8h (variable en fonction de votre rythme et de votre technique d’apprentissage) de travail à domicile. Une séance de 2h est programmée entre le module 1 et le module 2 afin d’installer les logiciels (SciViews Box, R, RStudio), et de se familiariser avec eux.
Les six premiers modules vont font découvrir les logiciels nécessaires pour effectuer les exercices de ce cours : R, RStudio, git. Ils sont également consacrés à l’importation, le remaniement et la visualisation de données biologiques.
Les six modules suivants s’attaquent à l’inférence statistique, c’est-à-dire, l’art de tirer des conclusions sur l’observation d’un phénomène biologique en présence d’incertitude, de variation entre individus et d’erreur de mesure qui sont impossible à éviter en biologie. Il s’agit ici d’utiliser de manière correcte les tests d’hypothèses statistiques et de réaliser des analyses de données reproductibles.