Module 6 Classification & indices
Objectifs
Appréhender les métriques multivariées importantes en biologie (indices de distance, indices de diversité).
Comprendre la notion de distance et la matrice de distance.
Maîtriser la classification ascendante hiérarchique (CAH) et le dendrogramme.
Maîtriser la technique de classification par les k-moyennes comme alternative à la CAH pour les gros jeux de données.
Appliquer ces techniques pour effectuer un regroupement pertinent à partir d’un jeu de données biologique.
Prérequis
Vous devez être à l’aise avec l’utilisation de R et RStudio, en particulier pour l’importation, le remaniement et la visualisation de données multivariées. Ceci correspond au cours SDD I. Cette partie est relativement indépendante de SDD II : modélisation qui forme la première section de cet ouvrage. Par conséquent, ces deux sections peuvent très bien être inversées si vous le souhaitez (si vous êtes en dehors d’un cours qui impose un ordre bien défini, bien entendu).