• Science des données biologiques I
  • Préambule
    • Vue générale du cours
    • Matériel pédagogique
    • Comment apprendre ?
    • Approche pédagogique
      • Classe inversée & pédagogie active
      • Quatre niveaux d’exercices
      • Plan du cours
    • Issues
    • Planning des séances
  • I SDD I: visualisation
  • 1 Introduction & visualisation I
    • 1.1 Découverte des outils
      • 1.1.1 SciViews Box
      • 1.1.2 RStudio
      • 1.1.3 R, les éléments de base
    • 1.2 Nuage de points
      • 1.2.1 Échelles de graphiques
      • 1.2.2 Transformation des données
    • 1.3 Premier projet
      • 1.3.1 GitHub Classroom
      • 1.3.2 GitHub
      • 1.3.3 Projet RStudio
      • 1.3.4 Gestionnaire de version
      • 1.3.5 Quarto/R Markdown
      • 1.3.6 Rechercher d’aide
    • 1.4 Récapitulatif des exercices
  • 2 Visualisation II
    • 2.1 Langage R
    • 2.2 Histogramme
      • 2.2.1 Nombre de classes
      • 2.2.2 Histogramme par facteur
    • 2.3 Graphique de densité
    • 2.4 Diagramme en violon
    • 2.5 Visualiser des distributions
    • 2.6 Travail collaboratif
      • 2.6.1 Issues
      • 2.6.2 Git
      • 2.6.3 Gestion de conflit
    • 2.7 Récapitulatif des exercices
  • 3 Visualisation III
    • 3.1 Graphique en barres
      • 3.1.1 Effectifs par facteur
      • 3.1.2 Effectifs par deux facteurs
      • 3.1.3 Valeurs moyennes
    • 3.2 Graphique en camembert
    • 3.3 Boite à moustaches
      • 3.3.1 Taille de l’échantillon
      • 3.3.2 En fonction de deux facteurs
    • 3.4 Figures composées
      • 3.4.1 Facettes
      • 3.4.2 Graphiques assemblés
    • 3.5 Différents moteurs graphiques
      • 3.5.1 {ggplot2}
      • 3.5.2 {lattice}
      • 3.5.3 Graphiques de base
    • 3.6 Travail collaboratif II
      • 3.6.1 Projet commun
      • 3.6.2 Projet extérieur
      • 3.6.3 Branches de git
    • 3.7 Critique graphique
    • 3.8 Challenge
    • 3.9 Récapitulatif des exercices
  • 4 Traitement des données I
    • 4.1 Importation des données
      • 4.1.1 Données sur le disque
      • 4.1.2 Données depuis Internet
      • 4.1.3 Données depuis un package
    • 4.2 Types de variables
    • 4.3 Conversion de variables
      • 4.3.1 Quantitatif continu à discret
      • 4.3.2 Quantitatif à qualitatif
      • 4.3.3 Découpage en classes
      • 4.3.4 Qualitatif ordonné ou non
    • 4.4 Remaniement des données
      • 4.4.1 select()/sselect()
      • 4.4.2 filter()/sfilter()
      • 4.4.3 mutate()/smutate()
      • 4.4.4 group_by()/sgroup_by()
      • 4.4.5 summarise()/ssummarise()
    • 4.5 Chaînage des instructions
      • 4.5.1 Opérateur pipe de base ou léger |>
    • 4.6 Récapitulatif des exercices
  • 5 Traitement des données II
    • 5.1 Tableaux de données
      • 5.1.1 Tableaux cas par variables
      • 5.1.2 Tableau de contingence
      • 5.1.3 Métadonnées
      • 5.1.4 Dictionnaire des données
    • 5.2 Population et échantillonnage
      • 5.2.1 Échantillonnage aléatoire
      • 5.2.2 Échantillonnage stratifié
    • 5.3 Acquisition de données
      • 5.3.1 Précision et exactitude
      • 5.3.2 Codification des données
      • 5.3.3 Respect de la vie privée
    • 5.4 Recombinaison de tableaux
      • 5.4.1 Formats long et large
      • 5.4.2 Recombinaison de variables
    • 5.5 Traitements multi-tableaux
      • 5.5.1 Empilement vers le bas
      • 5.5.2 Empilement à droite
      • 5.5.3 Fusion de tableaux
    • 5.6 Récapitulatif des exercices
  • II SDD I: inférence
  • 6 Probabilités, distributions I & corrélation
    • 6.1 Probabilités
      • 6.1.1 Dépistage
      • 6.1.2 Arbre des probabilités
      • 6.1.3 Théorème de Bayes
      • 6.1.4 Probabilités et contingence
    • 6.2 Lois de distributions
    • 6.3 Distribution uniforme
      • 6.3.1 Distribution discrète
      • 6.3.2 Distribution continue
      • 6.3.3 Quantiles vers probabilités
      • 6.3.4 Probabilités vers quantiles
      • 6.3.5 Calculs dans R
    • 6.4 Distribution normale
      • 6.4.1 Une “courbe en cloche”
      • 6.4.2 Loi normale réduite
      • 6.4.3 Fonctions dans R pour la normale
      • 6.4.4 Théorème central limite
    • 6.5 Corrélation
      • 6.5.1 Association de deux variables
    • 6.6 Test de corrélation
      • 6.6.1 Échantillonnage
      • 6.6.2 Test d’hypothèse
    • 6.7 Récapitulatif des exercices
  • 7 Distribution & Test Chi carré
    • 7.1 Distribution binomiale
      • 7.1.1 Épreuve de Bernoulli
      • 7.1.2 Calculs et graphiques
    • 7.2 Distribution de Poisson
      • 7.2.1 Évènements rares
      • 7.2.2 Loi de Poisson dans R
    • 7.3 Distribution log-normale
      • 7.3.1 Transformée log
      • 7.3.2 Fonction dans R pour la log-normale
    • 7.4 Graphique quantile-quantile
    • 7.5 Test Chi carré
      • 7.5.1 Test d’hypothèse
      • 7.5.2 Seuil α du test
      • 7.5.3 Effet de l’effectif étudié
    • 7.6 Métriques
      • 7.6.1 Morphométrie de crabes
    • 7.7 Récapitulatif des exercices
  • 8 Moyenne
    • 8.1 Une histoire de bière…
    • 8.2 Distribution d’échantillonnage
      • 8.2.1 Loi de distribution de Student
      • 8.2.2 Intervalle de confiance
      • 8.2.3 Théorème central limite (encore)
    • 8.3 Test t de Student
    • 8.4 Variantes du test t de Student
      • 8.4.1 Variances inégales
      • 8.4.2 Test unilatéral
      • 8.4.3 Test t apparié
      • 8.4.4 Test t univarié
    • 8.5 Test de Wilcoxon
    • 8.6 Représentation graphique
    • 8.7 Récapitulatif des exercices
  • 9 Variance I
    • 9.1 Le danger des tests multiples
    • 9.2 ANOVA à un facteur
      • 9.2.1 Modèle de l’ANOVA
      • 9.2.2 Distribution F
    • 9.3 Test “post-hoc”
    • 9.4 Test de Kruskal-Wallis
      • 9.4.1 Test “post hoc” non paramétrique
    • 9.5 Récapitulatif des exercices
  • 10 Variance II
    • 10.1 ANOVA à deux facteurs
    • 10.2 Modèle sans interactions
    • 10.3 Modèle croisé complet
    • 10.4 Facteurs hiérarchisés
      • 10.4.1 Simplification du modèle
    • 10.5 Effet aléatoire
      • 10.5.1 Modèle en parcelles divisées (split-plot)
      • 10.5.2 Modèle à mesures répétées
    • 10.6 Syntaxe de R
      • 10.6.1 Indiçage dans R
      • 10.6.2 Comparaison de styles
    • 10.7 Challenge
    • 10.8 Récapitulatif des exercices
  • Appendices
  • A Installation de la SciViews Box
  • B Prise en main
    • B.1 RStudio
      • B.1.1 Projet dans RStudio
      • B.1.2 Scripts R dans RStudio
      • B.1.3 Quarto/R Markdown/R Notebook
    • B.2 GitHub
      • B.2.1 Votre activité et profil
      • B.2.2 Vos projets
      • B.2.3 Permettre à RStudio de communiquer avec GitHub
      • B.2.4 Créer un dépôt
      • B.2.5 Cloner un dépôt existant via RStudio
      • B.2.6 Déposer un projet déjà créé
      • B.2.7 Copier un dépôt
    • B.3 GitHub Classroom
  • C Tutoriels “learnr”
    • C.1 Organisation d’un learnr
      • C.1.1 Objectifs
      • C.1.2 Introduction
      • C.1.3 Divers exercices
      • C.1.4 Conclusion
  • D Rédaction scientifique
    • D.1 Organisation
    • D.2 Contenu
      • D.2.1 Table des matières
      • D.2.2 Introduction
      • D.2.3 But
      • D.2.4 Matériel & méthodes
      • D.2.5 Résultats
      • D.2.6 Discussion
      • D.2.7 Conclusion(s)
      • D.2.8 Bibliographie (ou références)
    • D.3 Nom des espèces
  • E Communication & esprit critique
    • E.1 Communication
      • E.1.1 Présentations R Markdown et Quarto
    • E.2 Critique statistique
  • Références
  • Site Web du cours
  • Site Github du cours

  • Publié avec bookdown

Science des données biologiques I

6.7 Récapitulatif des exercices

Vous venez de terminer le module six. Ce module vous a permis d’apprendre les bases des probabilités, de découvrir les premières lois de distributions, la corrélation et les premiers éléments concernant les tests d’hypothèse. Pour évaluer votre compréhension de cette matière, vous aviez les exercices suivants à réaliser :

  • h5p A06Ha_proba1 - Lecture de probabilités
  • h5p A06Hb_proba2 - Validité d’un test
  • h5p A06Hc_proba3 - Lecture de probabilités 2
  • tuto A06La_proba - Calculs des probabilités
  • h5p A06Hd_distribution - Distribution continue
  • h5p A06He_distribution2 - Complétez la fonction punif()
  • h5p A06Hf_distribution3 - Complétez la fonction qunif()
  • h5p A06Hg_set_seed - Fonction set.seed()
  • tuto A06Lb_distri - Calculs avec une distribution normale
  • h5p A06Hh_covariance - Covariance entre deux variables
  • h5p A06Hi_pearson - Avantage du coefficient de corrélation de Pearson
  • h5p A06Hj_association - Association de deux variables
  • h5p A06Hk_corplot - Variables les plus corrélées
  • h5p A06Hl_matrice_covariance - Matrice de variance-covariance
  • h5p A06Hm_echantillon - Méthode d’échantillonnage
  • h5p A06Hn_inference - Inférence statistique
  • h5p A06Ho_hypothese - Hypothèse nulle
  • h5p A06Hp_cor_test - Test de corrélation
  • tuto A06Lc_correlation - Coefficients et tests de corrélation
  • git A06Ia_correlation - Association entre des variables
Progression

Cliquez pour visualiser le rapport de progression.