Module 8 Projets

Ce second et dernier module du cours SDD IV : pratique vous prépare à la plus grosse partie du travail que vous allez réaliser durant ce cours : l’analyse des données d’un gros projet de recherche, qu’il soit basé sur les résultats de votre travail de fin d’études ou sur des données similaires. Les gros projets ne diffèrent pas tellement de ceux que vous avez réalisés jusqu’ici dans les différents cours de science des données, si ce n’est que la quantité de données, le nombre d’étapes (importation - préparation - description - analyse) et les éléments discutés sont plus nombreux, et par conséquent, le nombre de fichiers l’est également. Cela nécessite une organisation et une discipline soignées afin que le projet reste compréhensible et utilisable par vous-même bien sûr, mais aussi par d’autres… y compris votre futur vous5 !

Objectifs
  • Structurer un projet de recherche pour sa partie analyse des données

  • Importer et retravailler les données de manière claire et reproductible

  • Utiliser un carnet de notes à bon escient pour explorer différentes pistes dans l’analyse

  • Rédiger un ou plusieurs documents de synthèse qui reprennent les éléments importants de l’analyse et les communiquent clairement et de manière reproductible à la communauté scientifique

Prérequis

Dans ce module, nous traiterons de RStudio et des projets RStudio, de R Markdown, de Git et GitHub, ainsi que de divers outils de R pour importer, remanier, décrire et analyser des données biologiques. Toutes ces notions doivent être parfaitement connues avant d’aborder le présent module qui va vous emmener un niveau plus loin, vers un gros projet constitué de plusieurs étapes successives dans l’analyse. Toutes ces notions ont été utilisées en routine dans les trois cours précédents SDD I, SDD II et SDD III (les six premiers modules du présent cours). Ainsi, si vous avez bien suivi ces trois cours-là, vous êtes en principe parfaitement préparé pour aborder cette matière.