6.1 Analyse de données

L’analyse de données (on parle aussi d’analyse exploratoire des données, EAD ou statistiques exploratoires) met en œuvre des méthodes statistiques multivariées visant à découvrir de l’information pertinente dans un gros jeu de données via des approches multidimensionnelles et essentiellement descriptives. Ces méthodes se regroupent en deux grandes familles :

  • Celles visant à réduire la dimensionnalité (travailler avec des tableaux ayant moins de colonnes). Elles permettent ensuite de présenter les données de manière synthétique pour observer des relations entre les variables ou les individus via des représentations graphiques. Nous aborderons ces techniques dans les modules suivants.

  • Celles cherchant à classifier (ou regrouper) les individus. Il s’agit ici de synthétiser le gros tableau de données dans l’autre sens, selon les lignes. L’approche par la classification ascendante hiérarchique sera détaillée ici, de même que la méthode des k-moyennes.

La vidéo suivante introduit l’EAD (jusqu’à 2:11) :

À vous de jouer !
h5p