Module 1 Classification supervisée I

Objectifs
  • Comprendre le principe général de la classification supervisée

  • Être capable d’utiliser l’analyse discriminante linéaire pour faire de la classification supervisée

  • Maîtriser les matrices de confusion

  • Comprendre la logique et être capable d’utiliser les différentes métriques calculables sur base de la matrice de confusion

Prérequis

Si ce n’est déjà fait, vous devez installer et vous familiariser avec la ‘SciViews Box’ nouvelle mouture. RStudio et (R) Markdown ne doivent plus avoir de secrets pour vous. Vous devez aussi maîtriser les bases de Git et de GitHub (avoir un compte GitHub, être capable de cloner un dépôt localement, travailler avec GitHub Desktop pour faire ses “commits”, “push” et “pull”). L’ensemble de ces outils a été abordé dans le cours de science des données biologiques partie 1.

Nous avons déjà abordé dans le cours de science des données biologiques partie 2 la notion de classification non supervisée. De même, la modélisation (via les régressions) a aussi fait l’objet d’une attention particulière dans le cours précédent. Toutes ces connaissances vont servir de pilier de base pour ce que nous étudierons ensemble dans ce module, ainsi que dans les deux suivants concernant la classification supervisée.