Module 1 Classification supervisée I
Objectifs
Comprendre le principe général de la classification supervisée
Être capable d’utiliser l’analyse discriminante linéaire pour faire de la classification supervisée
Maîtriser les matrices de confusion
Comprendre la logique et être capable d’utiliser les différentes métriques calculables sur base de la matrice de confusion
Prérequis
Avant de vous lancer tête baissée dans de la matière nouvelle, assurez-vous d’avoir installé la SciViews Box 2024. Si ce n’est pas encore fait, retournez à la page d’accueil pour bien débuter.
Vous devez être à l’aise dans l’utilisation de R, RStudio, (R) Markdown/Quarto, ainsi que Git et GitHub. Si ce n’est pas le cas, l’annexe B du cours de Science des données I devraient vous aider à vous remettre à niveau.
À vous de jouer !
Vous devez maîtriser les bases de Git et de GitHub (avoir un compte GitHub, être capable de cloner un dépôt localement, travailler avec l’onglet Git de RStudio pour faire un “commit”, “push” et “pull”).
À vous de jouer !
L’utilisation de tous ces outils a été expliquée dans les cours précédents SDD I et SDD II. Nous ne reviendrons pas dessus et cette matière est considérée comme acquise.
Outre les outils, ce cours s’appuie sur des notions que nous avons déjà abordées dans le cours de science des données biologiques 2 la notion de classification non supervisée. De même, la modélisation (via les régressions) a aussi fait l’objet d’une attention particulière dans le cours précédent. Toutes ces connaissances vont servir de pilier de base pour ce que nous étudierons ensemble dans ce module, ainsi que dans les deux suivants concernant la classification supervisée.
À vous de jouer !
Assurez-vous que vous possédez encore bien les bases de l’utilisation de R pour importer, remanier, visualiser des données, pour réaliser un test d’hypothèse, une régression linéaire et une analyse multivariée. Prenez également connaissance des nouveautés introduites dans la SciViews Box 2024 au travers du learnr suivant.
À vous de jouer !
Réalisez le travail C01Ia_debug, partie I.
Travail individuel pour les étudiants inscrits au cours de Science des Données Biologiques III à l’UMONS à terminer avant le 2024-10-14 23:59:59.
Initiez votre projet GitHub Classroom
Voyez les explications dans le fichier README.md
, partie I.
Effectuez maintenant les exercices du tutoriel C00La_refresh (Rappels et nouveautés de la SciViews Box 2024).
BioDataScience3::run("C00La_refresh")