2.1 R, les éléments de base
Dans le module précédent, vous avez pu découvrir que le logiciel R allait être un outil central dans cette formation en science des données. Par exemple, vous avez édité votre premier document R Markdown qui est la combinaison du R et du Markdown. Nous avons volontairement laissé ce logiciel pour ce second module.
R est un logiciel open source spécialisé dans l’analyse de données. Le langage de programmation R qu’il implémente est mature et développé depuis 1993. Il prend ses sources dans le langage S (spécialement conçu pour les statistiques dans les années 1970). R permet, entre autres, la manipulation et la visualisation de données, ainsi que l’application de calculs statistiques. C’est l’un des systèmes les plus utilisés et les plus puissants pour l’analyse des données. Donc, étudier R sera un investissement clé pour votre future carrière de biologiste, car des données, vous en aurez tous à analyser plus tard dans votre travail !
À vous de jouer !
Dans le premier module, vous avez réalisé un premier tutoriel qui contenait uniquement des questions à choix multiples. Ces tutoriels servent aussi à vous entraîner à écrire des instructions en R. Avant de vous lancer dans ces exercices, consultez l’Appendice C pour apprendre à utiliser correctement les tutoriels “learnrs”.
Effectuez maintenant les exercices du tutoriel A02La_base (Les bases de R).
BioDataScience1::run("A02La_base")
Vous venez de découvrir les assignations, les fonctions, le chaînage d’instructions… Lancez-vous à présent dans une première une analyse concrète.
Effectuez maintenant les exercices du tutoriel A02Lb_progression (Progression R).
BioDataScience1::run("A02Lb_progression")
(BioDataScience1 est un package R spécialement développé pour ce cours et qui est préinstallé dans votre SciViews Box).