Science des données biologiques
Préambule
Vue générale du cours
Matériel pédagogique
Comment apprendre?
Evaluation
I Cours I: visualisation et inférence
1
Introduction
1.1
Le monde il y a 25 ans
1.2
Découverte des outils
1.2.1
Machine virtuelle
1.2.2
RStudio
1.2.3
Markdown
1.2.4
Gestionnaire de version
1.3
Site web professionnel
2
Visualisation I
2.1
Nuage de points
2.1.1
Le nuage de points en vidéo
2.1.2
Echelles de graphiques
2.1.3
Transformation des données
2.2
Graphiques dans R Markdown
2.2.1
R Markdown en vidéo
3
Visualisation II
3.1
Histogramme
3.1.1
Nombre de classes
3.1.2
Histogramme par facteur
3.2
Graphique de densité
3.3
Diagramme en violon
3.4
Visualiser des distributions
4
Visualisation III
4.1
Graphique en barres
4.1.1
Effectifs par facteur
4.1.2
Effectifs par 2 facteurs
4.1.3
Valeurs moyennes
4.2
Graphique en camembert
4.3
Boite de dispersion
4.3.1
Taille de l’échantillon
4.3.2
En fonction de 2 facteurs
4.4
Figures composées
4.4.1
Facettes
4.4.2
Graphiques assemblés
4.5
Différents moteurs graphiques
4.5.1
ggplot2
4.5.2
lattice
4.5.3
Graphiques de base
5
Traitement des données I
5.1
Importation des données
5.1.1
Données sur le disque
5.1.2
Données depuis Internet
5.1.3
Données depuis un package
5.2
Types de variables
5.3
Conversion de variables
5.3.1
Quantitatif continu à discret
5.3.2
Quantitatif à qualitatif
5.3.3
Découpage en classes
5.3.4
Qualitatif ordonné ou non
5.4
Remaniement des données
5.4.1
select()
5.4.2
filter()
5.4.3
mutate()
5.4.4
group_by()
5.4.5
summarise()
5.5
Chaînage des instructions
6
Traitement des données II
6.1
Tableaux de données
6.1.1
Tableaux cas par variables
6.1.2
Tableaux de contingence
6.1.3
Métadonnées
6.1.4
Dictionnaire des données
6.2
Population et échantillonnage
6.3
Acquisition de données
6.3.1
Précision et exactitude
6.3.2
Codification des données
6.4
Recombinaison de tableaux
6.4.1
Formats long et large
6.4.2
Recombinaison de variables
6.5
Traitements multi-tableaux
6.5.1
Empilement vers le bas
6.5.2
Empilement à droite
6.5.3
Fusion de tableaux
7
Probabilités & distributions
7.1
Probabilités
7.1.1
Dépistage
7.1.2
Arbre des probabilités
7.1.3
Théorème de Bayes
7.1.4
Probabilités et contingence
7.2
Lois de distributions
7.3
Distribution uniforme
7.3.1
Distribution discrète
7.3.2
Distribution continue
7.3.3
Quantiles vers probabilités
7.3.4
Probabilités vers quantiles
7.3.5
Calcul avec les snippets
7.4
Distribution binomiale
7.4.1
Epreuve de Bernoulli
7.4.2
Calculs et graphiques
7.5
Distribution de poisson
7.5.1
Evénements rares
7.5.2
Loi de Poisson dans R
7.6
Distribution normale
7.6.1
Une “courbe en cloche”
7.6.2
Loi normale réduite
7.6.3
Fonctions et snippets
7.6.4
Théorème central limite
7.7
Distribution log-normale
7.7.1
Transformée log
7.7.2
Snippets
7.8
Graphique quantile-quantile
8
Test Chi carré
8.1
Échantillonnage
8.2
Test d’hypothèse
8.2.1
Becs croisés des sapins
8.2.2
Test Chi
2
univarié
8.2.3
Seuil α du test
8.2.4
Effet de l’effectif étudié
8.2.5
Test Chi
2
d’indépendance
8.2.6
Autres tests Chi
2
8.3
Evaluation par les pairs
9
Moyenne
9.1
Une histoire de bière…
9.2
Distribution d’échantillonnage
9.2.1
Loi de distribution de Student
9.2.2
Intervalle de confiance
9.2.3
Théorème central limite (encore)
9.3
Test
t
de Student
9.4
Variantes du test
t
de Student
9.4.1
Variances inégales
9.4.2
Test unilatéral
9.4.3
Test
t
apparié
9.4.4
Test
t
univarié
9.5
Test de Wilcoxon
9.6
Représentation graphique
10
Variance
10.1
Le danger des tests multiples
10.2
ANOVA à un facteur
10.2.1
Modèle de l’ANOVA
10.2.2
Distribution
F
10.3
Test “post-hoc”
10.4
Test de Kruskal-Wallis
10.4.1
Test “post hoc” non paramétrique
10.5
Sciences des données et littérature
11
Variance II
11.1
ANOVA à deux facteurs
11.2
Modèle sans interactions
11.3
Modèle croisé complet
11.4
Facteurs hiérarchisés
11.4.1
Simplification du modèle
11.5
Effet aléatoire
11.6
Syntaxe de R
11.6.1
Indiçage dans R
11.6.2
Comparaison de styles
12
Corrélation
12.1
Association de deux variables
12.1.1
Matrice de corrélation
12.1.2
Corrélogramme
12.1.3
Importance des graphiques
12.1.4
Matrice de nuages de points
12.1.5
Matrice de variances-covariances
12.1.6
Corrélations de Spearman et Kendall
12.1.7
Test de corrélation
12.2
Communication
12.2.1
Présentations R Markdown
12.3
Critique statistique
Appendices
A
Installation de la SciViews Box
A.1
Prérequis
A.1.1
Ordinateur
A.1.2
Activation de la virtualisation
A.1.3
Conseils pour acheter un PC
A.2
Installation
A.2.1
VirtualBox
A.2.2
SciViews Box
A.2.3
Github Desktop
A.3
Configuration
A.3.1
Lanceur SciViews Box
A.3.2
Configurateur de la Box
A.3.3
Installation des tutoriels
A.3.4
Accès aux fichiers
A.4
Utilisation
B
Prise en main
B.1
RStudio
B.1.1
Projet dans RStudio
B.1.2
Scripts R dans RStudio
B.1.3
R Markdown/R Notebook
B.2
GitHub
B.3
GitHub Classroom
C
Tutoriels “learnr”
D
Rédaction scientifique
D.1
Organisation
D.2
Contenu
D.2.1
Table des matières
D.2.2
Introduction
D.2.3
But
D.2.4
Matériel & méthodes
D.2.5
Résultats
D.2.6
Discussion
D.2.7
Conclusion(s)
D.2.8
Bibliographie (ou références)
D.3
Nom des espèces
Références
Dernière version de ce cours
Site Web du cours
Site Github du cours
Publié avec bookdown
Science des données biologiques
B.2
GitHub
TODO
Please enable JavaScript to view the
comments powered by Disqus.