6.5 Indices de diversité
Au premier abord, la notion de biodiversité est simple. Elle représente toute la variété des formes de la vie des gènes jusqu’à l’écosystème. Cependant réduire toute cette richesse à un seul nombre n’est pas quelque chose d’évident. Les scientifiques vont donc avoir recours à ce que l’on appelle des indices de diversité pour tenter de la quantifier. Ces indices sont des paramètres qui sont fréquemment utilisés pour obtenir des informations sur l’état de communautés végétales ou animales, leur viabilité ou leur évolution dans le temps par exemple. Ils permettront également d’apprécier la diversité qui peut exister entre des zones ou des milieux différents. Le choix d’un indice dépendra de la taille de l’échantillon, du type de données et de la résolution spatiale. Dès lors, il existe différentes expressions de la diversité :
- la diversité alpha (\(\alpha\)) ou diversité locale, entre les différents relevés à l’intérieur d’une zone (diversité intrazone),
- la diversité bêta (\(\beta\)) : diversité de relevé entre des zones différentes (diversité interzone),
- la diversité gamma (\(\gamma\)) qui représente la richesse spécifique globale.
6.5.1 Diversité alpha
6.5.1.1 Richesse spécifique
Le premier indice et le plus simple à calculer correspond à la richesse spécifique (S) et représente le nombre d’espèces que compte une communauté sans tenir compte de l’abondance relative de chacune des espèces. Vous pouvez l’obtenir très facilement avec la fonction vegan::specnumber()
.
Le jeu de données BCI
du package {vegan} contient les valeurs de dénombrement obtenues suite au recensement des arbres sur 50 parcelles de 1 hectare sur l’île de Barro Colorado (BCI = Barro Colorado Island). Le nombre total d’espèces recensées sur les 50 parcelles est de 225. Prenons, un sous-ensemble de cinq parcelles de ce jeu de données et cherchons à identifier la richesse spécifique pour chacune d’entre-elles.
SciViews::R("explore")
bci <- read("BCI", package = "vegan")
set.seed(2003)
bci_sub %<-% sample_n(bci, 5)
# Exploration partielle des données (15 premières espèces)
skimr::skim(bci_sub[, 1:15])
Name | bci_sub[, 1:15] |
Number of rows | 5 |
Number of columns | 15 |
Key | NULL |
_______________________ | |
Column type frequency: | |
numeric | 15 |
________________________ | |
Group variables | None |
Variable type: numeric
skim_variable | n_missing | complete_rate | mean | sd | p0 | p25 | p50 | p75 | p100 | hist |
---|---|---|---|---|---|---|---|---|---|---|
Abarema.macradenia | 0 | 1 | 0.0 | 0.00 | 0 | 0 | 0 | 0 | 0 | ▁▁▇▁▁ |
Vachellia.melanoceras | 0 | 1 | 0.4 | 0.89 | 0 | 0 | 0 | 0 | 2 | ▇▁▁▁▂ |
Acalypha.diversifolia | 0 | 1 | 0.0 | 0.00 | 0 | 0 | 0 | 0 | 0 | ▁▁▇▁▁ |
Acalypha.macrostachya | 0 | 1 | 0.2 | 0.45 | 0 | 0 | 0 | 0 | 1 | ▇▁▁▁▂ |
Adelia.triloba | 0 | 1 | 0.2 | 0.45 | 0 | 0 | 0 | 0 | 1 | ▇▁▁▁▂ |
Aegiphila.panamensis | 0 | 1 | 0.4 | 0.55 | 0 | 0 | 0 | 1 | 1 | ▇▁▁▁▅ |
Alchornea.costaricensis | 0 | 1 | 2.2 | 0.45 | 2 | 2 | 2 | 2 | 3 | ▇▁▁▁▂ |
Alchornea.latifolia | 0 | 1 | 0.2 | 0.45 | 0 | 0 | 0 | 0 | 1 | ▇▁▁▁▂ |
Alibertia.edulis | 0 | 1 | 0.0 | 0.00 | 0 | 0 | 0 | 0 | 0 | ▁▁▇▁▁ |
Allophylus.psilospermus | 0 | 1 | 0.4 | 0.55 | 0 | 0 | 0 | 1 | 1 | ▇▁▁▁▅ |
Alseis.blackiana | 0 | 1 | 15.8 | 5.40 | 12 | 12 | 14 | 16 | 25 | ▇▂▁▁▂ |
Amaioua.corymbosa | 0 | 1 | 0.0 | 0.00 | 0 | 0 | 0 | 0 | 0 | ▁▁▇▁▁ |
Anacardium.excelsum | 0 | 1 | 1.4 | 1.34 | 0 | 0 | 2 | 2 | 3 | ▇▁▁▇▃ |
Andira.inermis | 0 | 1 | 0.6 | 0.55 | 0 | 0 | 1 | 1 | 1 | ▅▁▁▁▇ |
Annona.spraguei | 0 | 1 | 0.6 | 0.89 | 0 | 0 | 0 | 1 | 2 | ▇▁▂▁▂ |
# [1] 85 91 99 85 93
Comme on peut le voir, cet indice permet de connaître le nombre d’espèces présent sur chaque parcelle. Mais est-ce que chaque espèce est présente de manière équitable ? Ou est-ce que certaines espèces sont plus abondantes que d’autres ? Cet indice ne tient pas compte de l’abondance dans son calcul et ne permet donc pas de répondre à ces questions. Par contre, l’indice de Shannon peut nous aider à répondre à cette question.
6.5.1.2 Indice de Shannon
L’indice de Shannon ou de Shannon-Weaver, introduit en écologie comme une mesure de la stabilité des communautés, prend en compte lors de son calcul la richesse et l’abondance relative des espèces contrairement à la richesse spécifique. La formule mathématique de l’indice de Shannon est la suivante :
\[H = - \sum_{i=1}^S p_i \ log_b\ p_i\]
où :
- \(p_i\) représente l’abondance proportionnelle de l’espèce et est compris entre 0 et 1 : \(p_i = \frac{n_i}{N}\)
- \(S\) est la richesse spécifique
- \(b\) la base du logarithme
- \(n_i\) est le nombre d’individus d’une espèce dans l’échantillon
- \(N\) est le nombre total d’individus de toutes les espèces dans l’échantillon : \(N = \sum_{i=1}^S n_i\)
L’indice H de Shannon varie donc en fonction du nombre d’espèces et de la proportion relative de ces différentes espèces. H vaudra 0 quand l’échantillon ne contient qu’une seule espèce et augmente lorsque le nombre d’espèces augmente. Plus l’indice H est élevé, plus la diversité est grande. À nombre d’espèces égal, H sera maximal et vaudra \(log_b S\) quand toutes les espèces sont également représentées.
Pour calculer l’indice de Shannon avec R, vous pouvez utiliser la fonction vegan::diversity()
. Celle-ci demande comme argument :
- x : des données sur une communauté sous la forme d’un vecteur ou d’une matrice
- index : le choix d’un indice de biodiversité, ici
"shannon"
(valeur pas défaut, donc, pouvant être omis ici) - base : la base du logarithme lors du calcul de l’indice de Shannon. Par défaut, la fonction utilise le logarithme népérien.
# [1] 3.693896 3.913725 3.969925 3.776575 4.018412
6.5.1.3 Indice d’équitabilité de Piélou
L’indice de Shannon est rarement utilisé seul. Il est souvent accompagné de l’indice d’équitabilité de Piélou qui permet de mesurer la répartition des individus au sein des espèces. Il s’agit là d’un paramètre plus rigoureux et très utile pour comparer des dominances potentielles entre sites puisqu’il est indépendant de la richesse spécifique. Il traduit donc le degré de diversité qui est atteint par un peuplement et se calcule comme suit :
\[J = \frac{H}{H_{max}}\]
où :
- \(H\) correspond à l’indice de Shannon
- \(H_{max}\) correspond à la valeur de la diversité théorique maximale (\(log_b\ S\))
- \(S\) est la richesse spécifique
La valeur de l’indice d’équitabilité de Piélou (J) varie donc entre 0 et 1 où 0 correspond à la dominance d’une des espèces et 1 à l’équirépartition des individus entre les différentes espèces.
Il n’existe pas de fonction pour calculer cet indice dans R mais on peut le calculer facilement à partir de l’indice de Shannon que l’on vient de calculer et avec la fonction vegan::specnumber()
pour connaître la richesse spécifique.
# [1] 85 91 99 85 93
# [1] 0.8314621 0.8676229 0.8639438 0.8500724 0.8865579
Il est important de noter que ces deux indices restent dépendants de la taille des échantillons et sont sensibles aux espèces rares.
6.5.1.4 Indice de Simpson
Il existe plusieurs indices permettant d’évaluer la biodiversité parmi lesquels on retrouve l’indice de Simpson. Cet indice aussi appelé indice de dominance mesure la probabilité que deux individus tirés au hasard à partir d’un échantillon appartiennent à la même espèce. Avec cet indice, on donne plus de poids aux espèces abondantes par rapport aux espèces rares. Dès lors, l’ajout d’une espèce rare à un échantillon ne modifiera pratiquement pas la valeur de l’indice de diversité.
\[D = \sum_{i=1}^S p_i^2\]
où :
- \(p_i\) représente l’abondance proportionnelle de l’espèce et est compris entre 0 et 1 : \(p_i = \frac{n_i}{N}\)
- \(S\) est la richesse spécifique
Sous cette forme, l’indice est inversement proportionnel à la diversité. La formulation suivante a donc été proposée pour que l’indice soit directement représentatif de la diversité. \[E = 1 - \sum_{i=1}^S p_i^2\]
L’indice de Simpson varie dans l’intervalle \([0,1[\). Cet indice tend donc vers 0 lorsque la diversité est minimale et vers \(1 - \frac{1}{S}\) lorsque la diversité est maximale. Il vaudra donc 0 si une seule espèce est présente et une probabilité de \(p_i = 1\) et \(1 - \frac{1}{S}\) si les différentes espèces présentes ont la même probabilité \(p_i = \frac{1}{S}\). Le calcul de cet indice dans R se fait aussi avec la fonction diversity()
, mais en précisant l’argument index=
: vegan::diversity(, index = "simpson")
.
# [1] 0.9499296 0.9676412 0.9686058 0.9627557 0.9746293
6.5.2 Diversité beta
La diversité \(\beta\) traduit la diversité inter-stations. Pour identifier le degré de similarité, d’association entre des groupes ou la diversité de différenciation des espèces entre différents habitats, on utilise les coefficient ou indice de similarité ou de similitude. Le choix adéquat d’un indice de similarité n’est pas évident et la question à se poser est de savoir si le fait qu’une espèce soit absente ou non contribue à augmenter la dissimilarité. Nous avons étudié ces indices de dissimilarité au début du module et nous savons déjà qu’il en existe plusieurs. Nous allons vous présenter un autre indice qui s’applique sur des données de type présence-absence : l’indice de Jaccard.
Cet indice permet une comparaison entre deux sites, car il évalue la ressemblance en calculant le rapport entre les espèces communes aux deux sites et celles propres à chaque relevé. La formule est la suivante :
\[I = \frac{N_c}{N_1 + N2 – N_c}\]
où :
- \(N_c\) correspond au nombre de taxons communs entre les deux sites
- \(N_1\) et \(N_2\) le nombre de taxons présents sur le site 1 et 2, respectivement
Les valeurs de l’indice varient entre 0 lorsque les deux sites n’ont aucune espèce en commun, et 1 quand les deux sites ont toutes leurs espèces en commun. Dès lors plus la valeur est proche de 1, plus les sites sont similaires.
Dans SciViews R, l’indice est calculé avec la fonction dissimilarity()
(indice de dissimilarité). L’indice de similarité est complémentaire à l’indice de dissimilarité et se calcule comme d’habitude comme son complément à 1 :
\[ similarité = 1 – dissimilarité\]
Regardons comment calculer l’indice de dissimilarité de Jaccard pour nos cinq parcelles avec R :
# Dissimilarity matrix with metric: jaccard
# # A data.frame: 5 x 5
# labels `1` `2` `3` `4`
# <chr> <dst> <dst> <dst> <dst>
# 1 1
# 2 2 0.483
# 3 3 0.492 0.480
# 4 4 0.455 0.533 0.528
# 5 5 0.517 0.551 0.545 0.425
Pour en savoir plus
L’introduction des indices de diversité dans
vegan
par son auteur (en anglais),Un document très détaillé décrivant les différents indices de diversité en français,