5.1 Analyse de données

L’analyse de données (on parle aussi d’analyse exploratoire des données, EAD ou statistiques exploratoires) mets en œuvre des méthodes statistiques multivariées visant à découvrir de l’information pertinente dans un gros jeu de données via des approches multidimensionnelles et essentiellement descriptives. Ces méthodes se regroupent en deux grandes familles :

  • Celles visant à réduire la dimensionnalité (travailler avec des tableaux ayant moins de colonnes). Elles permettent ensuite de présenter les données de manière synthétique pour observer des relations entre les variables ou les individus via des représentations graphiques. Nous aborderons ces techniques dans les modules suivants.

  • Celles cherchant à classifier (ou regrouper) les individus. Il s’agit ici de synthétiser le gros tableau de données dans l’autre sens, selon les lignes. L’approche via la classification hiérarchique sera détaillée ici.

La vidéo suivante introduit l’EAD (jusqu’à 2:11) :

À vous de jouer !
h5p