• Science des données biologiques II
  • Préambule
    • Vue générale du cours
    • Matériel pédagogique
    • Approche pédagogique
      • Classe inversée & pédagogie active
      • Quatre niveaux d’exercices
      • Plan du cours
    • Issues
    • Planning des séances
  • I SDD II: modélisation
  • 1 Régression linéaire I
    • 1.1 Modèle
      • 1.1.1 Pourquoi modéliser ?
      • 1.1.2 Quand modéliser ?
      • 1.1.3 Entraînement et confirmation
    • 1.2 Régression linéaire simple
      • 1.2.1 Quantifier l’ajustement d’un modèle
      • 1.2.2 La fonction lm()
      • 1.2.3 Résumé avec summary_()
      • 1.2.4 Paramétrisation du modèle
    • 1.3 Outils de diagnostic
      • 1.3.1 Analyse des résidus
      • 1.3.2 Enveloppe de confiance
      • 1.3.3 Extraire les données d’un modèle
    • 1.4 Récapitulatif des exercices
  • 2 Régression linéaire II
    • 2.1 Outils de diagnostic (suite)
      • 2.1.1 Résumé avec summary_()(suite)
      • 2.1.2 Comparaison de régressions
    • 2.2 Régression linéaire multiple
    • 2.3 Régression linéaire polynomiale
    • 2.4 RMSE & critère d’Akaike
    • 2.5 Modèle empirique et mécaniste
    • 2.6 Récapitulatif des exercices
  • 3 Modèle linéaire
    • 3.1 Variables numériques ou facteurs
    • 3.2 ANOVA et régression linéaire
      • 3.2.1 Modèle linéaire commun
      • 3.2.2 Réencodage des variables de l’ANOVA
    • 3.3 Matrice de contraste
      • 3.3.1 Contrastes orthogonaux
      • 3.3.2 Autres matrices de contrastes courantes
    • 3.4 ANCOVA
      • 3.4.1 Oursins plus ou moins lourds
      • 3.4.2 Choix du modèle
      • 3.4.3 Bébés à la naissance
    • 3.5 Récapitulatif des exercices
  • 4 Modèle linéaire généralisé
    • 4.1 Modèle linéaire généralisé
      • 4.1.1 GLM Poisson : ray-grass dans les dunes
      • 4.1.2 GLM binomiale avec proportions : maturation d’ovocytes
      • 4.1.3 GLM binomiale avec variable binaire : acariens
    • 4.2 Modèle linéaire généralisé mixte
      • 4.2.1 Ajustement et analyse d’un GLMM
      • 4.2.2 Simplification du modèle
      • 4.2.3 Intervalles de confiance des paramètres
      • 4.2.4 Difficultés d’ajustement
      • 4.2.5 Analyse des résidus
      • 4.2.6 Prédictions à l’aide d’un GLMM
    • 4.3 Récapitulatif des exercices
  • 5 Régression non linéaire
    • 5.1 Rendement photosynthétique
    • 5.2 Principe
      • 5.2.1 Fonction objective
      • 5.2.2 Calcul itératif
      • 5.2.3 Pièges et difficultés
      • 5.2.4 Modèles ‘selfStart’ dans R
    • 5.3 Modèles courants en biologie
      • 5.3.1 Modèle de Michaelis-Menten
      • 5.3.2 Modèles de croissance
      • 5.3.3 Courbe exponentielle
      • 5.3.4 Courbe logistique
      • 5.3.5 Modèle de Gompertz
      • 5.3.6 Modèles de von Bertalanffy
      • 5.3.7 Modèle de Richards
      • 5.3.8 Modèle de Weibull
      • 5.3.9 Modèle Preece-Baines 1
      • 5.3.10 Modèle de Tanaka
    • 5.4 Choix du modèle
    • 5.5 Challenge
    • 5.6 Récapitulatif des exercices
  • II SDD II: analyse
  • 6 Classification & indices
    • 6.1 Analyse de données
    • 6.2 Distance entre individus
      • 6.2.1 Matrice de distance
      • 6.2.2 Indices de (dis)similarité
      • 6.2.3 Utilisation des indices
      • 6.2.4 Propriétés des indices
    • 6.3 Regroupement avec CAH
      • 6.3.1 Dendrogramme
      • 6.3.2 Séparer les groupes
      • 6.3.3 Méthodes de CAH
      • 6.3.4 Étude complète
    • 6.4 K-moyennes
      • 6.4.1 Exemple simple
      • 6.4.2 Classification du zooplancton
    • 6.5 Indices de diversité
      • 6.5.1 Diversité alpha
      • 6.5.2 Diversité beta
    • 6.6 Récapitulatif des exercices
  • 7 ACP & AFC
    • 7.1 Réduction de dimensions grâce à l’ordination
    • 7.2 Analyse en composantes principales
      • 7.2.1 Indiens diabétiques
      • 7.2.2 Biométrie d’oursin
      • 7.2.3 Visualisation de données quantitatives
      • 7.2.4 ACP : mécanisme
      • 7.2.5 Calcul matriciel ACP
    • 7.3 Analyse factorielle des correspondances
      • 7.3.1 Enquête sur la science
      • 7.3.2 Communautés d’acariens
      • 7.3.3 Principe de l’AFC
    • 7.4 Challenge
    • 7.5 Récapitulatif des exercices
  • 8 AFM & big data
    • 8.1 Analyse factorielle multiple (AFM)
      • 8.1.1 AFM dans SciViews::R
      • 8.1.2 Plancton en Méditerranée
      • 8.1.3 AFM avec données mixtes
    • 8.2 Big data
      • 8.2.1 Gros jeux de données dans R
      • 8.2.2 Tableaux de millions de lignes
      • 8.2.3 Format de stockage
      • 8.2.4 Gros jeux de données et git/GitHub
      • 8.2.5 Bases de données à la rescousse
    • 8.3 Récapitulatif des exercices
  • 9 Bases de données & MDS
    • 9.1 Accès aux bases de données
      • 9.1.1 Drivers de bases de données dans RStudio
      • 9.1.2 Base de données dans un fichier
      • 9.1.3 Normalisation des données
      • 9.1.4 Requête dans une base de données relationnelle avec {dm}
    • 9.2 Positionnement multidimensionnel (MDS)
      • 9.2.1 MDS métrique ou PCoA
      • 9.2.2 MDS non métrique
    • 9.3 Récapitulatif des exercices
  • 10 Données ouvertes & SOM
    • 10.1 Données ouvertes
      • 10.1.1 Gestion des données
      • 10.1.2 Utilisation de données ouvertes
    • 10.2 Cartes auto-adaptatives (SOM)
      • 10.2.1 SOM sur le zooplancton
      • 10.2.2 Interprétation d’une SOM
    • 10.3 Récapitulatif des exercices
  • Appendices
  • A Installation de la SciViews Box
    • A.1 Migration des projets
    • A.2 Configuration
      • A.2.1 Compte GitHub dans RStudio
  • Références
  • Site Web du cours
  • Site Github du cours

  • Publié avec bookdown

Science des données biologiques II

1.4 Récapitulatif des exercices

Ce premier module vous a permis de prendre connaissance des principes de bases de la modélisation et plus particulièrement de la régression linéaire simple par les moindres carrés. Pour évaluer votre compréhension de cette matière, vous aviez les exercices suivants à réaliser :

  • h5p B01Ha_variables_parametres - Paramètres et variables d’une équation
  • h5p B01Hb_association - Association entre deux variables
  • h5p B01Hc_correlation - Les coefficients de corrélation
  • h5p B01Hd_somme_residus - Qualité d’ajustement d’un modèle
  • app B01Sa_reglin - Ajuster la meilleure droite
  • h5p B01He_equation - Écriture de l’équation du modèle
  • h5p B01Hf_lm - La fonction lm()
  • h5p B01Hg_std_error - Analyse du résumé de l’objet lm.
  • tuto B01La_reg_lin - Récapitulatif régression linéaire simple
  • h5p B01Hh_resid - Distribution homogène des résidus
  • tuto B01Lb_residuals - Analyse des résidus d’une régression
  • git B01Ia_debug - Débogage de script R
  • h5p B01Hi_tidy - Les fonctions tidy() et glance()
  • git B01Ib_abalone - Régression linéaire simple (ormeaux)
Progression

Cliquez pour visualiser le rapport de progression.