Module 6 Classification & indices

Objectifs
  • Appréhender les métriques multivariées importantes en biologie (indices de distance, indices de diversité).

  • Comprendre la notion de distance et la matrice de distance.

  • Maîtriser la classification ascendante hiérarchique et le dendrogramme.

  • Maîtriser la technique de classification par les k-moyennes comme alternative à la CAH pour les gros jeux de données.

  • Appliquer ces techniques pour effectuer un regroupement pertinent à partir d’un jeu de données biologique.

  • Découvrir les indices de diversité biologique.

Prérequis

Vous devez être à l’aise avec l’utilisation de R et RStudio, en particulier pour l’importation, le remaniement et la visualisation de données multivariées. Ceci correspond au cours SDD I. Cette partie est relativement indépendante de SDD II : modélisation qui forme la première section de cet ouvrage. Par conséquent, ces deux sections peuvent très bien être inversées si vous le souhaitez (si vous êtes en dehors d’un cours qui impose un ordre bien défini, bien entendu).