10.1 ANOVA à deux facteurs
Dans le cadre de l’ANOVA à un facteur, nous avions une variable réponse numérique étudiée pour différents niveaux d’une seule variable facteur à j niveaux ou modalités. Le modèle utilisé était :
\[y_{ij} = \mu + \tau_j + \epsilon_i \mathrm{\ avec\ } \epsilon \sim N(0, \sigma)\]
Les \(\tau_j\) représentent les variations entre la moyenne générale \(\mu\) et les moyennes respectives des \(j\) sous-populations comme \(\mu + \tau_j\). En R, nous avons utilisé la formule suivante :
\[y \sim fact\]
avec \(y\) la variable numérique réponse et \(fact\) la variable facteur explicative unique.
Si nous prenons notre exemple des crabes L. variegatus, nous avions travaillé un peu artificiellement sur une seule variable facteur en regroupant les deux variables species
et sex
en une seule variable group
. Qu’en est-il si nous voulons quand même considérer les deux variables species
et sex
séparément ? c’est possible avec une ANOVA à deux facteurs. N’oubliez pas que les variables facteurs dans vos équations doivent bien être encodées comme objets factor ou ordered dans R. Si ces variables sont encodées comme valeurs numériques, la fonction lm()
utilisée ici fera une autre analyse que l’ANOVA (elle fera une régression linéaire que nous aborderons dans le cours de science des données II) !