2.1 R, les éléments de base

Dans le module précédent, vous avez pu découvrir que le logiciel R allait être un outil central dans cette formation en science des données. Par exemple, vous avez édité votre premier document Quarto qui combine R (pour les calculs, les graphiques et les tables) avec du Markdown (pour le formatage du texte). Nous allons maintenant nous initier aux rudiments de l’utilisation de R.

R est un logiciel open source (c’est-à-dire que son code source est disponible ; un logiciel est constitué de la compilation d’un code source qui peut être rendu public comme ici, ou non) spécialisé dans l’analyse de données. Le langage de programmation R qu’il implémente est mature et développé depuis 1993. Il prend ses sources dans le langage S (spécialement conçu pour les statistiques dans les années 1970). R permet, entre autres, la manipulation et la visualisation de données, ainsi que les calculs statistiques. C’est l’un des logiciels les plus utilisés et les plus puissants pour l’analyse des données, avec Python, Julia et Matlab. Donc, étudier R sera un investissement clé pour votre future carrière de biologiste, car des données, vous en aurez tous à en analyser !

À vous de jouer !

Dans le premier module, vous avez réalisé un premier tutoriel qui contenait principalement des questions à choix multiples. Ces tutoriels servent aussi à vous entraîner à écrire des instructions en R. Avant de vous lancer dans ces exercices, consultez l’Appendice C pour apprendre à utiliser correctement ces tutoriels learnrs pour les questions relatives à du code R.

Effectuez maintenant les exercices du tutoriel A02La_base (Les bases de R).

BioDataScience1::run("A02La_base")

Vous venez de découvrir les assignations, les fonctions, le chaînage d’instructions… Lancez-vous à présent dans une première analyse concrète de données biologiques.

Effectuez maintenant les exercices du tutoriel A02Lb_progression (Progression R).

BioDataScience1::run("A02Lb_progression")

(BioDataScience1 est un package R spécialement développé pour ce cours et qui est préinstallé dans votre SciViews Box).

h5p