3.2 Graphique de densité
L’histogramme n’est pas le seul outil à votre disposition. Vous pouvez également employer le graphique de densité qui se présente un peu comme un histogramme lissé. Le passage d’un histogramme vers un graphe de densité se base sur une estimation par noyaux gaussien12
Figure 3.5: A. Histogramme et B. graphique de densité montrant la distribution de la taille de zooplancton étudié par analyse d’image.
Comme pour les autres graphiques, veuillez à soigner les indications qui permettent d’interpréter le graphique. Outre la courbe de densité, il faut :
- Les axes avec les graduations (en rouge)
- les labels des axes, et l’unité pour l’axe des abscisses (en bleu)
Les instructions en R pour produire un graphique de densité avec la fonction chart()
sont :
# Importation du jeu de données
(zooplankton <- read("zooplankton", package = "data.io", lang = "FR"))
# # A tibble: 1,262 x 20
# ecd area perimeter feret major minor mean mode min max
# <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# 1 0.770 0.465 4.45 1.32 1.16 0.509 0.363 0.0360 0.00400 0.908
# 2 0.700 0.385 2.32 0.728 0.713 0.688 0.361 0.492 0.0240 0.676
# 3 0.815 0.521 4.15 1.33 1.11 0.598 0.308 0.0320 0.00800 0.696
# 4 0.785 0.484 4.44 1.78 1.56 0.394 0.332 0.0360 0.00400 0.728
# 5 0.361 0.103 1.71 0.739 0.694 0.188 0.153 0.0160 0.00800 0.452
# 6 0.832 0.544 5.27 1.66 1.36 0.511 0.371 0.0200 0.00400 0.844
# 7 1.23 1.20 15.7 3.92 1.37 1.11 0.217 0.0120 0.00400 0.784
# 8 0.620 0.302 3.98 1.19 1.04 0.370 0.316 0.0120 0.00400 0.756
# 9 1.19 1.12 15.3 3.85 1.34 1.06 0.176 0.0120 0.00400 0.728
# 10 1.04 0.856 7.60 1.89 1.66 0.656 0.404 0.0440 0.00400 0.880
# # ... with 1,252 more rows, and 10 more variables: std_dev <dbl>,
# # range <dbl>, size <dbl>, aspect <dbl>, elongation <dbl>,
# # compactness <dbl>, transparency <dbl>, circularity <dbl>,
# # density <dbl>, class <fct>
# Réalisation du graphique
chart(data = zooplankton, ~ size) +
geom_density() +
ylab("Densité")
Figure 3.6: Distribution des tailles au sein de l’échantillon de zooplancton.
Ici, nous utilisons donc la fonction geom_density()
.
L’opération effectuée pour passer d’un histogramme à une courbe de densité consiste effectivement à lisser les pics plus ou moins fort dans l’histogramme de départ.↩