• Science des données biologiques I
  • Préambule
    • Vue générale du cours
    • Matériel pédagogique
    • Comment apprendre ?
    • Approche pédagogique
      • Classe inversée & pédagogie active
      • Quatre niveaux d’exercices
      • Plan du cours
    • Issues
    • Planning des séances
  • I SDD I: visualisation
  • 1 Introduction & visualisation I
    • 1.1 Découverte des outils
      • 1.1.1 SciViews Box
      • 1.1.2 RStudio
      • 1.1.3 R, les éléments de base
    • 1.2 Nuage de points
      • 1.2.1 Échelles de graphiques
      • 1.2.2 Transformation des données
    • 1.3 Premier projet
      • 1.3.1 GitHub Classroom
      • 1.3.2 GitHub
      • 1.3.3 Projet RStudio
      • 1.3.4 Gestionnaire de version
      • 1.3.5 Quarto/R Markdown
      • 1.3.6 Rechercher d’aide
    • 1.4 Récapitulatif des exercices
  • 2 Visualisation II
    • 2.1 Langage R
    • 2.2 Histogramme
      • 2.2.1 Nombre de classes
      • 2.2.2 Histogramme par facteur
    • 2.3 Graphique de densité
    • 2.4 Diagramme en violon
    • 2.5 Visualiser des distributions
    • 2.6 Travail collaboratif
      • 2.6.1 Issues
      • 2.6.2 Git
      • 2.6.3 Gestion de conflit
    • 2.7 Récapitulatif des exercices
  • 3 Visualisation III
    • 3.1 Graphique en barres
      • 3.1.1 Effectifs par facteur
      • 3.1.2 Effectifs par deux facteurs
      • 3.1.3 Valeurs moyennes
    • 3.2 Graphique en camembert
    • 3.3 Boite à moustaches
      • 3.3.1 Taille de l’échantillon
      • 3.3.2 En fonction de deux facteurs
    • 3.4 Figures composées
      • 3.4.1 Facettes
      • 3.4.2 Graphiques assemblés
    • 3.5 Différents moteurs graphiques
      • 3.5.1 {ggplot2}
      • 3.5.2 {lattice}
      • 3.5.3 Graphiques de base
    • 3.6 Travail collaboratif II
      • 3.6.1 Projet commun
      • 3.6.2 Projet extérieur
      • 3.6.3 Branches de git
    • 3.7 Critique graphique
    • 3.8 Challenge
    • 3.9 Récapitulatif des exercices
  • 4 Traitement des données I
    • 4.1 Importation des données
      • 4.1.1 Données sur le disque
      • 4.1.2 Données depuis Internet
      • 4.1.3 Données depuis un package
    • 4.2 Types de variables
    • 4.3 Conversion de variables
      • 4.3.1 Quantitatif continu à discret
      • 4.3.2 Quantitatif à qualitatif
      • 4.3.3 Découpage en classes
      • 4.3.4 Qualitatif ordonné ou non
    • 4.4 Remaniement des données
      • 4.4.1 select()/sselect()
      • 4.4.2 filter()/sfilter()
      • 4.4.3 mutate()/smutate()
      • 4.4.4 group_by()/sgroup_by()
      • 4.4.5 summarise()/ssummarise()
    • 4.5 Chaînage des instructions
      • 4.5.1 Opérateur pipe de base ou léger |>
    • 4.6 Récapitulatif des exercices
  • 5 Traitement des données II
    • 5.1 Tableaux de données
      • 5.1.1 Tableaux cas par variables
      • 5.1.2 Tableau de contingence
      • 5.1.3 Métadonnées
      • 5.1.4 Dictionnaire des données
    • 5.2 Population et échantillonnage
      • 5.2.1 Échantillonnage aléatoire
      • 5.2.2 Échantillonnage stratifié
    • 5.3 Acquisition de données
      • 5.3.1 Précision et exactitude
      • 5.3.2 Codification des données
      • 5.3.3 Respect de la vie privée
    • 5.4 Recombinaison de tableaux
      • 5.4.1 Formats long et large
      • 5.4.2 Recombinaison de variables
    • 5.5 Traitements multi-tableaux
      • 5.5.1 Empilement vers le bas
      • 5.5.2 Empilement à droite
      • 5.5.3 Fusion de tableaux
    • 5.6 Récapitulatif des exercices
  • II SDD I: inférence
  • 6 Probabilités, distributions I & corrélation
    • 6.1 Probabilités
      • 6.1.1 Dépistage
      • 6.1.2 Arbre des probabilités
      • 6.1.3 Théorème de Bayes
      • 6.1.4 Probabilités et contingence
    • 6.2 Lois de distributions
    • 6.3 Distribution uniforme
      • 6.3.1 Distribution discrète
      • 6.3.2 Distribution continue
      • 6.3.3 Quantiles vers probabilités
      • 6.3.4 Probabilités vers quantiles
      • 6.3.5 Calculs dans R
    • 6.4 Distribution normale
      • 6.4.1 Une “courbe en cloche”
      • 6.4.2 Loi normale réduite
      • 6.4.3 Fonctions dans R pour la normale
      • 6.4.4 Théorème central limite
    • 6.5 Corrélation
      • 6.5.1 Association de deux variables
    • 6.6 Test de corrélation
      • 6.6.1 Échantillonnage
      • 6.6.2 Test d’hypothèse
    • 6.7 Récapitulatif des exercices
  • 7 Distribution & Test Chi carré
    • 7.1 Distribution binomiale
      • 7.1.1 Épreuve de Bernoulli
      • 7.1.2 Calculs et graphiques
    • 7.2 Distribution de Poisson
      • 7.2.1 Évènements rares
      • 7.2.2 Loi de Poisson dans R
    • 7.3 Distribution log-normale
      • 7.3.1 Transformée log
      • 7.3.2 Fonction dans R pour la log-normale
    • 7.4 Graphique quantile-quantile
    • 7.5 Test Chi carré
      • 7.5.1 Test d’hypothèse
      • 7.5.2 Seuil α du test
      • 7.5.3 Effet de l’effectif étudié
    • 7.6 Métriques
      • 7.6.1 Morphométrie de crabes
    • 7.7 Récapitulatif des exercices
  • 8 Moyenne
    • 8.1 Une histoire de bière…
    • 8.2 Distribution d’échantillonnage
      • 8.2.1 Loi de distribution de Student
      • 8.2.2 Intervalle de confiance
      • 8.2.3 Théorème central limite (encore)
    • 8.3 Test t de Student
    • 8.4 Variantes du test t de Student
      • 8.4.1 Variances inégales
      • 8.4.2 Test unilatéral
      • 8.4.3 Test t apparié
      • 8.4.4 Test t univarié
    • 8.5 Test de Wilcoxon
    • 8.6 Représentation graphique
    • 8.7 Récapitulatif des exercices
  • 9 Variance I
    • 9.1 Le danger des tests multiples
    • 9.2 ANOVA à un facteur
      • 9.2.1 Modèle de l’ANOVA
      • 9.2.2 Distribution F
    • 9.3 Test “post-hoc”
    • 9.4 Test de Kruskal-Wallis
      • 9.4.1 Test “post hoc” non paramétrique
    • 9.5 Récapitulatif des exercices
  • 10 Variance II
    • 10.1 ANOVA à deux facteurs
    • 10.2 Modèle sans interactions
    • 10.3 Modèle croisé complet
    • 10.4 Facteurs hiérarchisés
      • 10.4.1 Simplification du modèle
    • 10.5 Effet aléatoire
      • 10.5.1 Modèle en parcelles divisées (split-plot)
      • 10.5.2 Modèle à mesures répétées
    • 10.6 Syntaxe de R
      • 10.6.1 Indiçage dans R
      • 10.6.2 Comparaison de styles
    • 10.7 Challenge
    • 10.8 Récapitulatif des exercices
  • Appendices
  • A Installation de la SciViews Box
  • B Prise en main
    • B.1 RStudio
      • B.1.1 Projet dans RStudio
      • B.1.2 Scripts R dans RStudio
      • B.1.3 Quarto/R Markdown/R Notebook
    • B.2 GitHub
      • B.2.1 Votre activité et profil
      • B.2.2 Vos projets
      • B.2.3 Permettre à RStudio de communiquer avec GitHub
      • B.2.4 Créer un dépôt
      • B.2.5 Cloner un dépôt existant via RStudio
      • B.2.6 Déposer un projet déjà créé
      • B.2.7 Copier un dépôt
    • B.3 GitHub Classroom
  • C Tutoriels “learnr”
    • C.1 Organisation d’un learnr
      • C.1.1 Objectifs
      • C.1.2 Introduction
      • C.1.3 Divers exercices
      • C.1.4 Conclusion
  • D Rédaction scientifique
    • D.1 Organisation
    • D.2 Contenu
      • D.2.1 Table des matières
      • D.2.2 Introduction
      • D.2.3 But
      • D.2.4 Matériel & méthodes
      • D.2.5 Résultats
      • D.2.6 Discussion
      • D.2.7 Conclusion(s)
      • D.2.8 Bibliographie (ou références)
    • D.3 Nom des espèces
  • E Communication & esprit critique
    • E.1 Communication
      • E.1.1 Présentations R Markdown et Quarto
    • E.2 Critique statistique
  • Références
  • Site Web du cours
  • Site Github du cours

  • Publié avec bookdown

Science des données biologiques I

2.7 Récapitulatif des exercices

Ce module 2 vous a permis de réaliser différents graphiques uni- et bivariés afin de visualiser la distribution de variables quantitatives seules ou en fonction des niveaux d’une variable qualitative (facteur). Pour évaluer votre compréhension de cette matière, vous aviez les exercices suivants à réaliser :

  • tuto A02La_progression - Progression en R
  • h5p A02Ha_mean - Sélection de la fonction adéquate
  • h5p A02Hb_geom_histogram - Les fonctions chart() et geom_histogram()
  • h5p A02Hc_histogram - Modes et symétries
  • app A02Sa_histogram - Nombre de classes d’un histogramme
  • tuto A02Lb_univariate - Graphiques univariés
  • h5p A02Hd_geom_density - La fonction chart() et geom_density()
  • git A02Ia_distributions - Graphiques de distribution des données
  • h5p A02He_geom_violin - La fonction chart() et geom_violin()
  • h5p A02Hf_git_push2 - GitHub : repérer les pushs
  • h5p A02Hg_git_pull2 - GitHub : repérer les pulls
  • tuto A02Lc_git - Autoévaluation sur git
  • h5p A02Hh_conflit - Deux versions d’un même fichier
  • h5p A02Hi_resolution_conflit - Résolution d’un conflit
  • h5p A02Hj_gestion_conflit - Résolution d’un conflit (suite)
  • git A02Ga_analysis - Analyse de données (partie I, par groupe de 4)
Progression

Cliquez pour visualiser le rapport de progression.