2.1 R, les éléments de base
Dans le module précédent, vous avez pu découvrir que le logiciel R
allait être un logiciel central dans cette formation en science des données. Par exemple, vous avez édité votre premier document Rmarkdown qui est la combinaison du R et du Markdown. Nous avons volontairement laissé ce logiciel pour le second module.
R est un logiciel open source axé sur l’analyse de données. Le langage de programmation R qu’il implémente est mature et développé depuis 1993. Il prend ses sources dans le langage S (spécialement conçu pour les statistiques dans les années 1970). R permet entre autres la manipulation, la visualisation et l’application de calculs statistiques sur des données. C’est l’un des environnements les plus utilisés et les plus puissants pour l’analyse des données. Donc, étudier R sera un investissement clé pour votre future carrière de biologiste, car des données, vous en aurez tous à analyser dans votre travail !
À vous de jouer !
Vous allez maintenant découvrir les premiers rudiments de R afin de pouvoir réaliser par la suite vos premiers graphiques. Lors du premier module, vous avez réalisé un premier tutoriel qui comprenait uniquement des questions à choix multiples. Dans ces tutoriels, on peut également s’entraîner à écrire des instructions en R. Avant de vous lancer dans ces exercices, consultez l’Appendice C pour apprendre à utiliser correctement ces tutoriels.
Lancez-vous dans votre exploration des bases de R.
Effectuez maintenant les exercices du tutoriel A02La_base (Les bases de R).
BioDataScience1::run("A02La_base")
Vous venez de découvrir les assignations, les fonctions, le chaînage d’instructions… Lancez-vous à présent dans une première une analyse concrète.
Effectuez maintenant les exercices du tutoriel A02Lb_progression (Progression R).
BioDataScience1::run("A02Lb_progression")
(BioDataScience1 est un package R spécialement développé pour ce cours et que vous avez dû installer lors de la configuration de votre SciViews Box, voir Appendice A.3.5).