Document complémentaire au module 2 du cours SDD II de 2025-2026. Distribué sous licence CC BY-NC-SA 4.0.
Veuillez vous référer au cours en ligne pour les explications et les interprétations de cette analyse.
Installer un environnement R adéquat pour reproduire cette analyse.
# Dialecte SciViews::R avec la section dédiée à la modélisation
SciViews::R("model", lang = "fr")
# Importation des données depuis le package {datasets}
trees <- read("trees", package = "datasets")
# Régression (même modèle que dans le module 1)
trees_lm <- lm(data = trees, volume ~ diameter)
# Résumé du modèle
summary_(trees_lm)##
## Call:
## lm(formula = volume ~ diameter, data = trees)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.231211 -0.087021 0.003533 0.100594 0.271725
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.04748 0.09553 -10.96 7.85e-12 ***
## diameter 5.65154 0.27649 20.44 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1206 on 29 degrees of freedom
## Multiple R-squared: 0.9351, Adjusted R-squared: 0.9329
## F-statistic: 417.8 on 1 and 29 DF, p-value: < 2.2e-16
## Analysis of Variance Table
##
## Response: volume
## Df Sum Sq Mean Sq F value Pr(>F)
## diameter 1 6.0762 6.0762 417.8 < 2.2e-16 ***
## Residuals 29 0.4218 0.0145
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Analyse de la variance | ||||||
|---|---|---|---|---|---|---|
Terme | Ddl | Somme des carrés | Carrés moyens | Valeur de Fobs. | Valeur de p | |
diameter | 1 | 6.076 | 6.0762 | 418 | < 2·10-16 | *** |
Résidus | 29 | 0.422 | 0.0145 | |||
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | ||||||
| |||||
|---|---|---|---|---|---|
Terme | Valeur estimée | Ecart type | Valeur de t | Valeur de p | |
| -1.05 | 0.0955 | -11.0 | 7.85·10-12 | *** |
| 5.65 | 0.2765 | 20.4 | < 2·10-16 | *** |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||
Etendue des résidus : [-0.2312, 0.2717] | |||||
# Second modèle ajusté sur un sous-ensemble des données
trees_lm2 <- lm(data = trees, volume ~ diameter, subset = diameter < 0.5)
chart(trees_lm2)
| |||||
|---|---|---|---|---|---|
Terme | Valeur estimée | Ecart type | Valeur de t | Valeur de p | |
| -0.944 | 0.0931 | -10.1 | 6.98·10-11 | *** |
| 5.312 | 0.2754 | 19.3 | < 2·10-16 | *** |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||
Etendue des résidus : [-0.2151, 0.1814] | |||||
# Régression multiple utilisant deux variable indépendantes
trees_lm3 <- lm(data = trees, volume ~ diameter + height)
summary_(trees_lm3) |>
tabularise()
| |||||
|---|---|---|---|---|---|
Terme | Valeur estimée | Ecart type | Valeur de t | Valeur de p | |
| -1.6356 | 0.2446 | -6.69 | 2.95·10-07 | *** |
| 5.2564 | 0.2959 | 17.76 | < 2·10-16 | *** |
| 0.0311 | 0.0121 | 2.57 | 1.56·10-02 | * |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||
Etendue des résidus : [-0.1804, 0.2418] | |||||
Modèle | Ddl des résidus | Somme des carrés des résidus | Ddl | Somme des carrés | Valeur de Fobs. | Valeur de p | |
|---|---|---|---|---|---|---|---|
volume ~ diameter | 29 | 0.422 | |||||
volume ~ diameter + height | 28 | 0.341 | 1 | 0.0807 | 6.63 | 0.0156 | * |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||||
# Modèle polynomial d'ordre 2
trees_lm4 <- lm(data = trees, volume ~ diameter + I(diameter^2))
summary_(trees_lm4) |> tabularise()
| |||||
|---|---|---|---|---|---|
Terme | Valeur estimée | Ecart type | Valeur de t | Valeur de p | |
| 0.311 | 0.318 | 0.978 | 0.336293 |
|
| -2.372 | 1.838 | -1.290 | 0.207489 |
|
| 11.236 | 2.556 | 4.396 | 0.000144 | *** |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||
Etendue des résidus : [-0.1579, 0.215] | |||||
# Modèle simplifié
trees_lm5 <- lm(data = trees, volume ~ I(diameter^2) + 0)
summary_(trees_lm5) |>
tabularise()
| |||||
|---|---|---|---|---|---|
Terme | Valeur estimée | Ecart type | Valeur de t | Valeur de p | |
| 7.3 | 0.14 | 52.3 | < 2·10-16 | *** |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||
Etendue des résidus : [-0.1947, 0.1824] | |||||
# Modèle multiple et polynomial
trees_lm6 <- lm(data = trees, volume ~ diameter + I(diameter^2) + height)
summary_(trees_lm6) |>
tabularise()
| |||||
|---|---|---|---|---|---|
Terme | Valeur estimée | Ecart type | Valeur de t | Valeur de p | |
| -0.2671 | 0.28489 | -0.938 | 3.57·10-01 |
|
| -3.2814 | 1.46340 | -2.242 | 3.34·10-02 | * |
| 11.8917 | 2.01925 | 5.889 | 2.83·10-06 | *** |
| 0.0348 | 0.00817 | 4.259 | 2.23·10-04 | *** |
0 <= '***' < 0.001 < '**' < 0.01 < '*' < 0.05 | |||||
Etendue des résidus : [-0.1217, 0.1256] | |||||
## [1] 0.1166409
## [1] -39.24246
## [1] -43.82811
## [1] -53.50964
## [1] -50.15027
## [1] -67.4391
## [1] 0.06939391
## [1] 0.08972287