Vue générale du cours
Cet ouvrage est le premier d’une série de trois volumes traitant de la science des données biologiques. L’écriture de cette suite de livres a débuté au cours de l’année académique 2018-2019. Pour l’année académique 2023-2024, ceci est le support du cours de Science des données I : visualisation et inférence au second Bachelier en Biologie en Faculté des Sciences de l’Université de Mons, et dont le responsable est Philippe Grosjean.
La matière est divisée en 12 modules représentant chacun 6h de travail en présentiel. Chaque module nécessitera environ 8h (variable en fonction de votre rythme et de votre technique d’apprentissage) de travail à domicile. Une séance de 2h est programmée en début d’année afin d’installer les logiciels (SciViews Box, R, RStudio), et de se familiariser avec eux.
Les six premiers modules au premier quadrimestre vous font découvrir les logiciels nécessaires pour effectuer les exercices de ce cours : R, RStudio, git. Ils sont également consacrés à l’importation, le remaniement et la visualisation de données biologiques.
Les six modules suivants au second quadrimestre s’attaquent à l’inférence statistique, c’est-à-dire, l’art de tirer des conclusions sur l’observation d’un phénomène biologique en présence d’incertitude, de variation entre individus et d’erreur de mesure qui sont impossible à éviter en biologie. Il s’agit ici d’utiliser de manière correcte les tests d’hypothèses statistiques et de réaliser des analyses de données reproductibles.