7.1 Réduction de dimensions grâce à l’ordination

Ici, l’objectif n’est pas de regrouper ou de classifier les individus du tableau comme nous avons fait avec la CAH ou les k-moyennes, mais de les ordonner sur un graphique en nuage de points en deux ou trois dimensions. Ce graphique s’appelle une “carte”, et la technique qui la réalise est une méthode d’ordination.

Dès que le nombre de variables dans un tableau dépasse 3 ou 4, nous avons du mal à représenter l’information qu’il contient graphiquement. Une matrice de nuages de points pour des données quantitatives peut, à la limite, servir à représenter 3 à 6 variables en les visualisant deux à deux, mais les nuages de points deviennent vite trop petits et illisibles au fur et à mesure que le nombre de variables augmente.

En réalité, vous connaissez bien une technique de réduction des dimensions par projection. C’est comme cela que fonctionne votre œil ou l’objectif d’un appareil photographique. La scène que vous observez ou photographiez se déroule dans l’espace à trois dimensions. Mais la rétine de votre œil, l’écran de votre ordinateur, ou la feuille de papier sur laquelle vous imprimez vos photos sont à deux dimensions. Il y a donc une projection qui est réalisée de trois à deux dimensions. Ce faisant, une partie de l’information est perdue : certains objets peuvent, par exemple, en cacher d’autres et vous ne voyez que la face exposée des objets. Si le point de vue ne vous convient pas, vous pouvez bouger pour en adopter un autre qui fera que votre photo sera plus compréhensible : elle contiendra plus d’information utile à la comprendre.

Pièce présentée selon deux angles. À gauche, la pièce est vue depuis sa tranche (information insuffisante pour l’identifier sur la photo). À droite, la pièce est vue côté face (information suffisante). Le point de vue selon lequel l’objet 3D est projeté en 2D est important pour porter plus ou moins d’information pertinente sur l’objet.

Ce que nous voulons faire avec l’Analyse en Composantes Principales, c’est une généralisation de ce mécanisme de projection (de N variables à n < N dimensions, généralement deux ou trois), tout en choisissant le point de vue qui réalise cette projection le plus intéressant possible, c’est à dire, celui qui permettra de visualiser un maximum de l’information totale dans ce nombre réduit de dimensions. Nous voulons automatiser le choix du meilleur angle de vue. Notez que, bien souvent à l’image de la pièce de monnaie ci-dessus, ce meilleur angle correspond au point de vue qui présente la plus grande surface d’un objet dans le plan de la projection.

En statistique, cela correspond à réaliser une projection d’un ensemble à un autre qui va maximiser la variance des observations dans l’espace réduit choisi (le plan ou un espace à trois dimensions). Or, les mathématiciens savent très bien comment répondre à ce genre de question. Donc, c’est parfaitement réalisable avec un ordinateur.