B.1 RStudio
Une fois que vous avez démarré la SciViews Box, vous pourrez accéder à RStudio qui est une interface conviviale pour manipuler des analyses statistiques dans le logiciel R. On parle de “IDE” pour Integrated Development Environment en anglais, ou Environnement de développement intégré. RStudio59 permet de piloter vos analyses statistiques dans le logiciel R. En fait, R est un second logiciel, lancé en arrière-plan. C’est lui qui réalise effectivement les calculs demandés dans l’interface de RStudio. Si cela parait compliqué, ne vous inquiétez pas : cela se fait de manière totalement transparente. Si cela vous est demandé –dans la version Server de RStudio, mais pas dans la machine SaturnCloud– vous entrez votre login et mot de passe pour lancer votre session de travail. Dans la SciViews Box, ces informations sont :
- Username : sv
- Password : sv
- Cochez éventuellement Stay signed in pour éviter de devoir rentrer ces informations continuellement.
RStudio s’ouvre. La fenêtre principale comporte différents éléments :
- Une barre de menu et une barre d’outils générale en haut
- Un panneau à gauche intitulé Console où vous pouvez entrer des instructions qui sont envoyées à R pour manipuler vos données
- Un panneau à droite en haut qui comprend plusieurs onglets, dont Environment (ou Environnement si vous utilisez RStudio en français, noté dorénavant version anglaise || version française comme Environment || Environnement) qui vous indique les différents items –on parle d’objets– chargés en mémoire dans R. Mais pour l’instant, il n’y a encore rien dans cet onglet.
- Un panneau en bas à droite comportant lui aussi plusieurs onglets. Vous devriez voir le contenu de Files || Fichiers au démarrage, un explorateur de fichiers simplifié.
Pour l’instant, aucun document de travail n’est encore ouvert. Pour en créer un, ou ouvrir un document existant, vous utilisez le menu Files || Fichiers
, ou encore, le premier bouton de la barre d’outils générale :
Le menu Session
permet d’interagir directement avec R. Par exemple, il est possible de relancer R à partir d’une entrée de ce menu (Session -> Restart R || Session -> Redémarrer R
) :
Le menu Help || Aide
expose différentes entrées permettant d’accéder à la documentation de R ou de RStudio. Les aide-mémoires (Help -> Cheat Sheets || Aide -> Cheat Sheets
) sont très pratiques lors de l’apprentissage. Nous conseillons de les consulter régulièrement et éventuellement, de les imprimer pour s’y référer plus facilement sans encombrer votre espace de travail dans votre ordinateur.
Le dernier item de la barre d’outils générale, intitulé Project || Projet permet d’ouvrir, fermer, et gérer les projets RStudio, c’est-à-dire, des espaces de travail organisés autour d’une analyse particulière, et qui peuvent contenir plusieurs fichiers et sous-dossiers (ce sera détaillé ci-dessous).
Vous avez maintenant repéré les éléments les plus importants de l’interface de RStudio.
À ce stade, vous pouvez vous familiariser avec l’aide-mémoire relatif à l’IDE RStudio. Vous verrez qu’il y a beaucoup de fonctionnalités accessibles à partir de sa fenêtre principale. Ne vous laissez pas intimider : vous les apprendrez progressivement au fur et à mesure de votre utilisation du logiciel.
B.1.1 Projet dans RStudio
Un projet sert, dans RStudio, à organiser son travail. Il va regrouper l’ensemble des jeux de données, des rapports, des présentations, des scripts (fichiers composés d’une série d’instructions réalisant un traitement particulier) d’une analyse, généralement en relation avec une ou plusieurs expériences ou observations réalisées sur le terrain ou en laboratoire. Voici à quoi ressemble l’interface de RStudio lorsque vous ouvrez un projet :
Notez que le nom du projet est mentionné en haut à droite. Notez également que le répertoire de base de votre projet est le répertoire actif dans l’onglet Console (/media/shared/projects/mon_premier_projet/
dans l’exemple, mais dans SaturnCloud ce sera probablement plutôt ~/workspace/mon_premier_projet
). Remarquez aussi que l’onglet Files || Fichiers affiche son contenu. Un fichier mon_premier_projet.Rproj
y est créé automatiquement par RStudio. Ce fichier contient les paramètres de configuration propres à ce projet60. C’est aussi une excellente façon de repérer qu’un répertoire est la base d’un projet RStudio, en repérant ce fameux fichier .Rproj
.
B.1.1.1 Création d’un projet
Créez votre premier projet en suivant les quatre étapes suivantes :
Étape 1 : dans RStudio, cliquez sur l’item en haut à droite dans la barre d’outils générale de RStudio qui ouvre un menu relatif aux projets. Sélectionnez-y l’entrée
New Project... || Nouveau projet..
.Étape 2 : une boite de dialogue s’ouvre. Sélectionnez
New Directory || Nouveau répertoire
pour créer votre projet dans un nouveau dossier. Il est également possible d’employer un dossier existant comme point de départExisting Directory || Répertoire existant
).Étape 3 : sélectionnez
New Project || Nouveau projet
tout en haut dans la boite de dialogue suivante qui vous propose également des projets particuliers (que nous n’utiliserons pas pour l’instant).Étape 4 : RStudio vous demande quelques informations pour préconfigurer votre projet.
- Nommez le projet dans
Directory name || Nom du répertoire
. Indiquez iciproject_test
- Indiquez où vous voulez le placer dans
Create project as subdirectory of || Créer un projet en tant que sous-répertoire de
. Sélectionnez le sous-dossierworkspace
dans Saturn Cloud ou le sous-dossierprojects
dans le dossiershared
partagé entre la SciViews Box et la machine hôte si vous travaillez dans VirtualBox. - Cochez l’option
Create a git repository || Créer un répôt gity
. - Assurez-vous que l’option
Use renv with this project || Utiliser renv avec ce projet
soit bien décochée (il est très important de ne pas sélectionner renv, sous peine de réinstaller et dupliquer de nombreux dossiers et fichiers –appelés “packages” ou “paquets” R– dans votre projet)
- Nommez le projet dans
Vous utilisez le même menu déroulant Project || Projet
en haut à droite de la barre d’outils générale pour réouvrir un projet existant (Open Project... || Ouvrir le projet...
) ou fermer le projet actuel (Close Project || Fermer le projet
). Vous remarquez également que les derniers projets visités sont listés en dessous, ce qui permet d’y accéder plus rapidement.
Un projet ne doit bien sûr être créé qu’une seule
fois ! Une fois les étapes ci-dessus effectuées, vous retournez
simplement à votre projet en ouvrant le menu projets en haut à droite et
en sélectionnant votre projet dans la liste. S’il n’y apparaît pas,
choisissez Open Project… || Ouvrir le projet…
et
sélectionnez le fichier .Rproj
relatif à votre projet. Ne
créez bien évidemment jamais de projet à l’intérieur
des dossiers d’un autre projet, surtout si vous utilisez Git. Sinon,
RStudio va s’emmêler les pinceaux !
B.1.1.2 Organisation d’un projet
Le dossier workspace
(Saturn Cloud) ou projects
(SciViews Box dans VirtualBox) contient maintenant un projet RStudio intitulé project_test
. Depuis la SciViews Box, il se situe dans (version VirtualBox représentée ci-dessous) :
/home
/sv
/shared
/projects
/project_test # Répertoire de base du projet
project_test.Rproj # Fichier de configuration du projet RStudio
.gitignore # Fichier relatif à la gestion de version
Vous devez maintenant structurer votre projet afin d’avoir différents sous-dossiers pour organiser au mieux votre travail. Ceci concerne à la fois les données et les rapports d’analyse en lien avec ce projet.
Cliquez sur le bouton New Folder || Nouveau dossier
dans la barre d’outils de l’onglet Files || Fichiers
et appelez ce nouveau dossier data
. Ajoutez également le dossier R
de la même manière.
/home
/sv
/shared
/projects
/project_test # Répertoire de base du projet
data # Dossier contenant les données
project_test.Rproj # Fichier de configuration du projet RStudio
.gitignore # Fichier relatif à la gestion de version
R # Dossier contenant les scripts d'analyse
Vous obtenez donc un projet configuré de la manière suivante :
L’organisation cohérente d’un projet est indispensable pour le bon fonctionnement et la clarté de vos analyses de données.
B.1.1.3 Chemins relatifs dans un projet
L’utilisation d’un projet permet de structurer de manière cohérente son travail. Vous allez maintenant devoir rendre votre projet portable.
Un projet RStudio pourra être qualifié de portable s’il est possible de déplacer son répertoire de base et tout ce qu’il contient (ou le renommer) sans que les analyses qu’il réalise n’en soient affectées. Ceci est utile pour copier, par exemple, le projet d’un ordinateur à un autre, ou si vous décidez de restructurer vos fichiers sur le disque dur.
La première règle est de placer tous les fichiers nécessaires dans le dossier du projet ou dans un sous-dossier. C’est ce que nous venons de faire plus haut.
La seconde règle est de référencer les différents fichiers au sein du projet avec des chemins relatifs. Nous allons maintenant apprendre à faire cela. Partons d’un projet qui contient les dossiers et fichiers suivants :
/home
/sv
/shared
/projects
/project_test # Répertoire de base du projet
analysis # Dossier contenant les analyses
rapport_test.Rmd # Rapport d'analyse
data # Dossier contenant les données
dataset.csv # Jeu de données
project_test.Rproj # Fichier de configuration du projet RStudio
.gitignore # Fichier relatif à la gestion de version
R # Dossier contenant les scripts d'analyse
Les différents systèmes d’exploitation (Windows, macOS, Linux) utilisent des conventions différentes pour les chemins d’accès aux fichiers. Dans notre cas, la machine virtuelle dans SaturnCloud ou VirtualBox utilise un système d’exploitation Linux. La barre oblique (/
dite “slash” en anglais) sépare les différents dossiers imbriqués sous Linux et sous macOS. Le système d’exploitation Windows utilise, pour sa part, la barre oblique inverse (\
, dite “backslash” en anglais, mais dans R et RStudio, vous pourrez également utiliser le slash /
, ce que nous vous conseillons de faire toujours pour un maximum de compatibilité entre systèmes). Par exemple, votre fichier dataset.csv
qui contient les données du projet hypothétique d’exemple se référence comme suit dans VirtualBox, donc sous Linux :
/home/sv/shared/projects/project_test/data/dataset.csv
Ce chemin d’accès est le plus détaillé. Il est dit chemin d’accès absolu au fichier. Vous noterez qu’il est totalement dépendant de la structure actuelle des dossiers sur le disque. Si vous renommez project_test
ou si vous le déplacez ailleurs, la référence au fichier sera cassée ! Ainsi, si vous partagez votre projet, généré avec une SciViews Box fonctionnant dans VirtualBox avec un collaborateur qui utilise SaturnCloud, il installera le projet probablement dans /home/jovyan/workspace
61. Par conséquent, le chemin d’accès aux données devra être adapté en /home/jovyan/workspace/project_test/data/dataset.csv
, sans quoi l’analyse ne pourra plus s’exécuter correctement chez lui.
Décodons ce chemin d’accès :
/
, racine du système/home/sv/
, notre dossier personnel comme utilisateursv
/home/sv/shared/
, le dossier partagé entre la SciViews Box dans VirtualBox et notre ordinateur hôte/home/sv/shared/projects/project_test/
, le dossier de base de notre projet/home/sv/shared/projects/project_test/data/
, le répertoire qui contient le fichierdataset.csv
.
Le répertoire utilisateur /home/<user>
est différent sous macOS (il s’appelle /Users/<user>
) et sous Windows (il se nomme généralement C:\Users\<user>
). Comme c’est un répertoire clé, et qu’il est impossible d’écrire un chemin absolu qui soit le même partout, il existe un raccourci : le “tilde” (~
) qui signifie “mon répertoire utilisateur”. Ainsi, vous pouvez aussi accéder à votre jeu de données dataset.csv
comme ceci dans VirtualBox :
~/shared/projects/project_test/data/datasets.csv
Ce chemin d’accès est déjà plus “portable” d’un système à l’autre et d’un utilisateur à l’autre. Il est donc à préférer62. Si cette façon d’écrire le chemin d’accès est compatible entre les trois systèmes d’exploitation, elle ne permet toujours pas de déplacer ou de renommer notre projet.
L’utilisation d’un chemin relatif permet de définir la position d’un fichier par rapport à un autre dossier qui est dit “répertoire actif”. A titre d’exemple, nous voulons faire référence au jeu de données dataset.csv
depuis notre rapport rapport_test.Rmd
.
Demandez-vous d’abord quel est le répertoire actif. Pour un fichier R Markdown ou R Notebook, c’est facile, c’est le dossier qui contient ce fichier. Dans la console R, cela peut varier selon le contexte. Si vous avez ouvert un projet, c’est le répertoire de base du projet par défaut, mais cela peut être modifié. Le répertoire actif pour la console R est toujours indiqué en première ligne à côté de l’icône de R et de son numéro de version. Vous pouvez aussi interroger R à l’aide de l’instruction getwd()
qui vous indiquera alors quel est le répertoire actif :
Vous apprendrez que vous pouvez réaliser cela dans un script R (fichier regroupant une succession d’instructions), ou dans un chunk R (zone spéciale contenant des instructions à exécuter dans votre document) dans votre document R Markdown :
Une fois que vous connaissez le répertoire actif, vous naviguez à partir de celui-ci. Il existe une convention pour reculer d’un dossier dans la hiérarchie. Pour cela vous indiquez ..
à la place d’un nom de dossier. Voici ce que cela donne :
../data/dataset.csv
C’est un chemin relatif. Comment le lit-on ? Tout d’abord, notez –c’est très important– que le chemin d’accès ne commence pas par /
(Linux ou macOS), ou C:\
(ou toute autre lettre, sous Windows), ni par ~
. C’est le signe que l’on ne part pas de la racine du système de fichier ou du dossier de l’utilisateur, mais du répertoire actif. Ensuite, les différents éléments se décryptent comme suit :
~/shared/projects/project_test/analysis
, répertoire actif au départ pour le document R Notebook..
retourne en arrière d’un niveau. On est donc dans~/shared/projects/project_test
/data
navigue dans le sous-dossierdata
. On est donc maintenant dans~/shared/projects/project_test/data
. C’est le répertoire qui contient le fichier qui nous intéresse/datasets.csv
pointe bien vers le fichier qui nous intéresse.
À noter que si le fichier se trouve déjà dans le répertoire actif, le chemin relatif se résume au nom du fichier directement. C’est donc très simple dans ce cas.
Nulle part dans ce chemin relatif n’apparaît le nom du dossier de base du projet, ni aucun autre dossier parent. Ainsi, il est possible de renommer ou déplacer le projet sans casser la référence relative à n’importe quel fichier à l’intérieur de ce projet. Donc, en utilisant uniquement des références relatives, le projet reste parfaitement portable, y compris entre SaturnCloud et VirtualBox, par exemple.
B.1.1.4 Chemins portables avec here::here()
Il existe un autre mécanisme qui permet de référencer vos fichiers à l’intérieur de votre projet tout en assurant sa portabilité : la fonction here::here()
. Quel que soit l’endroit où vous vous situez dans le projet, ou dans n’importe lequel de ses sous-dossiers, cette fonction pointera toujours vers le dossier de base du projet (projet en cours s’il y en a un ouvert dans RStudio, ou projet recherché en amont dans la hiérarchie de fichiers à partir du répertoire actif dans le cas contraire), donc dans notre exemple, /home/sv/shared/projects/project_test
. La fonction accepte un ou plusieurs arguments sous forme de chaînes de caractères entre guillemets et séparés par une virgule qui complètent le chemin d’accès depuis ce répertoire de base. Donc, vous pouvez écrire here::here("data", "datasets.csv)
. Cela produira /home/sv/shared/projects/project_test/data/datasets.csv
qui est bien le chemin d’accès souhaité. Comme ce chemin d’accès est construit à la demande, la première partie correspondant au répertoire de base sera toujours bien calculée, même si le projet est déplacé ou renommé. Notez que vous auriez très bien pu aussi indiquer here::here("data/datasets.csv)
, cela fonctionnera aussi.
B.1.2 Scripts R dans RStudio
Un script R est une suite d’instructions qui peuvent être interprétées pour effectuer nos analyses. Ce script est stocké dans un fichier dont l’extension est .R
(attention : “R” majuscule), et que l’on placera de préférence dans le sous-dossier R
de notre projet.
Un script R s’ouvre dans la fenêtre d’édition de RStudio. Les parties de texte précédées d’un dièse (#
) sont des commentaires. Ils ne sont jamais exécutés, mais ils permettent de structurer et d’expliquer le contenu du document (ou bien d’empêcher temporairement l’exécution d’instructions). Voici un exemple de script R :
Pour bien documenter vos scripts, commencez-les toujours par quelques lignes de commentaires qui contiennent un titre, le nom du ou des auteurs, la date, un copyright éventuel, et une description courte de ce qu’il fait … L’utilisation de sections comme à la ligne 6 ci-dessus est vivement conseillée. Ces sections sont créées à l’aide de l’entrée de menu Code -> Insert Section... || Code -> Insérer une section...
dans RStudio. Elles sont reprises dans un menu déroulant depuis le bas de la fenêtre d’édition pour une navigation rapide dans le script.
B.1.2.1 Création d’un script R
Vous avez à votre disposition plusieurs méthodes pour créer un nouveau script R dans RStudio, dont deux vous sont montrées dans l’animation ci-dessous.
B.1.2.2 Utilisation d’un script R
Un script R est un document au format natif de R. R va interpréter les instructions qui composent le script et qui ne sont pas précédées d’un dièse (cliquez sur Run || Exécuter
dans la barre d’outils de la fenêtre d’édition, ou utilisez le raccourci clavier Ctrl+Entrée
(ou Cmd+Entrée
dans macOS) pour exécuter les instructions les unes après les autres.
Un script R doit être organisé de manière cohérente afin d’être exécutable de haut en bas. Dans l’exemple ci-dessus, on commence par :
Étape 1 : configuration de R en “mode SciViews” avec l’instruction
SciViews::R
.Étape 2 : instruction
urchin <- read("urchin_bio", package = "data.io")
pour lire le jeu de donnéesurchin_bio
provenant du package {data.io} (un “package” R est une sorte d’“addin” qui peut contenir de nouvelles fonctions, des jeux de données et de la documentation) et l’“assigner” ou “affecter” àurchin
(le nom sous lequel nous avons choisi de nous référer à l’objet créé dans R). On retrouve à présenturchin
dans l’environnement global (Global Environment
dans l’onglet Environment || Environnement dans la fenêtre en haut à droite) de RStudio. Cet onglet liste, en effet, tous les objets en mémoire dans la session actuelle de R.Étape 3 :
.?urchin
etView(urchin)
entrés à la console R (et validées en appuyant sur la toucheEntrée
) donnent des renseignements sur le jeu de données en renvoyant vers la page d’aide du jeu de données ou en ouvrant ce jeu de données dans une fenêtre de visualisation.Étape 4 : réaliser des graphiques avec une fonction de R nommée
chart()
. Une fonction est un petit programme qui réalise une tâche particulière sur base d’éléments fournis en entrée entre parenthèses, et que l’on nomme arguments de la fonction. À l’issue du traitement, la fonction renvoie un résultat que l’on peut envoyer vers une autre fonction ou “assigner” à un nom pour le réutiliser plus tard.
Notez que les instructions exécutées dans le script sont envoyées dans la fenêtre Console
en bas à gauche et que le résultat de leur exécution est affiché directement en dessous dans la même fenêtre.
B.1.3 Quarto/R Markdown/R Notebook
Un document Quarto est un fichier dont l’extension est .qmd
. Un document R Markdown a, quant à lui, une extension .Rmd
. Ces deux formats sont très similaires. Ils combinent à la fois des instructions R (pour les analyses) et le langage Markdown (un système de balisage de texte pour le formater, par exemple, pour définir un titre, une partie de texte en gras…), ce que l’on appelle le “R Markdwon”. Le R Markdown ne vous permet pas de visualiser directement le résultat final d’un rapport d’analyse63
Tout comme dans un script R, les instructions doivent également être exécutées lors de la réalisation du rapport. Une forme spéciale de document R Markdown est le R Notebook. Ce dernier est un peu un intermédiaire entre un script R et un document R Markdown. Il se présente de manière très similaire à ce dernier, mais vous pouvez devez exécuter le code qu’il contient ligne par ligne comme dans un script R pour obtenir le rendu, alors que le R Markdown ou le Quarto intégrera toujours l’exécution de code R à la compilation du document final. Si cela ne vous parait pas clair, pas d’inquiétude : vous comprendrez plus tard par la pratique.
Un document Quarto / R Markdown / R Notebook se structure de la manière suivante :
- Un préambule, encore appelé entête YAML (“YAML” est le nom du langage utilisé pour y encoder des informations)
- Des zones d’édition de texte (le langage employé est ici Markdown)
- Des zones de code appelées des chunks (aussi appelés “morceaux” dans RStudio en français)
Le préambule est nécessairement situé au tout début du document et est délimité à l’aide de trois tirets ---
sans rien d’autre sur une ligne au début et à la fin. Le préambule comporte un ensemble d’entrées de type nom: valeur
qui configurent le document ou la façon dont il sera compilé en document final (rapport, présentation, publication…). Nous pouvons y indiquer le titre principal, le ou les auteurs, la date …
Le reste du document Quarto / R Markdown est subdivisé en zones successives et contrastées sur des fonds de couleurs différentes qui alternent zones d’édition de texte et chunks. Ces chunks seront interprétés pour réaliser un calcul, un graphique, un tableau, etc. Le résultat de ce traitement sera placé au même endroit dans le document final. La présentation diffère profondément selon que le document est édité en mode “source” ou en mode “visuel”. On passe d’un mode à l’autre grâce aux deux boutons Source
et Visual
à la gauche de la barre d’édition du document.
En mode “visuel”, le document présente un rendu qui suggère la présentation finale, un peu comme Microsoft Word, mais gardez bien à l’esprit que le rendu final réel dépendra du style que vous appliquerez et du format de sortie choisi (dissociation entre contenu et rendu, contrairement à Word). Dans le mode visuel, vous effectuez la mise en forme de votre texte en utilisant les outils de la barre d’outils d’édition juste après le bouton Visual
. Par exemple pour créer un titre de niveau deux, vous cliquerez sur le quatrième item qui indique le format actuel (probablement Normal
, et vous sélectionnerez Header 2 || Titre 2
. Le paragraphe où se trouve le curseur est alors transformé en titre de niveau deux. Pour transformer un paragraphe en liste, vous irez dans Format -> Bullets & Numbering -> Bulletted List || Liste à puces
, et ainsi de suite. Les différents items parlent d’eux-mêmes pour la majorité. Explorez-les et expérimentez-les sur un document de test pour vous les approprier.
Le mode “source” est intéressant, car il expose la structure et le formatage du document en “brut de décoffrage”. Cela vous permet de voir comment le formatage Markdown se matérialise sous forme de “balises” dans le texte. Si vous basculez le document dans ce mode, vous découvrirez, par exemple, qu’un titre de niveau deux commence par deux dièses suivis d’un espace (## titre niveau 2
) et qu’une liste à points commence par un tiret suivi de trois espaces (- item de liste à points
). Ce mode permet aussi un contrôle plus fin sur le contenu de votre document, mais comme il nécessite de connaitre la signification des balises Markdown, vous préférerez certainement le mode visuel au début. En cours d’édition, vous pouvez basculer d’un mode à l’autre librement quand vous le souhaitez.
Toujours en mode source, les chunks sont balisés en entrée par trois apostrophes inverses suivies d’accolades contenant des instructions relatives au programme à utiliser sur une seule ligne, par exemple, ```{r}
pour des chunks faisant appel au logiciel R, et sont terminés par trois apostrophes inverses (```
), également sur une ligne sans rien d’autre. Entre les deux, les instructions R et les commentaires avec un dièse devant se présentent exactement comme dans un script R.
Structurez le contenu narratif de votre document Markdown à l’aide de titres de niveaux appropriés. Vous pouvez utiliser jusqu’à six niveaux de titres préfixés à l’aide d’un à six dièses et d’une espace. Utilisez donc un titre de niveau un pour le titre Introduction et des titres de niveau deux pour les sous-parties de votre introduction, et ainsi de suite.
B.1.3.1 Création d’un Quarto/R Markdown/R Notebook
Vous avez à votre disposition deux méthodes pour créer un nouveau document Quarto/R Markdown/R Notebook dans RStudio et l’ouvrir pour édition. Voyez l’animation ci-dessous.
B.1.3.2 Utilisation d’un Quarto/R Markdown/R Notebook
Afin de visualiser les résultats des chunks dans votre rapport final, vous devez veiller à exécuter chaque chunks dans l’ordre dans un R Notebook. Ceci n’est pas nécessaire dans un Quarto ou un R Markdown, mais dans ce cas, tous les chunks sont systématiquement réexécutés les uns après les autres à chaque génération de rapport, ce qui peut être pénible si les calculs sont longs.
Pour exécuter un chunk, vous pouvez :
- cliquer sur le bouton Play, sous forme d’une flèche verte pointant vers la droite, située en haut à droite du chunk
- cliquer sur
Run || Exécuter
et sélectionnerRun Current Chunk || Exécuter le Chunk actuel
dans le menu déroulant qui apparaît - Employer le raccourci clavier
Ctrl+Shift+Entrée
(ouCmd+Shift+Entrée
sous macOS)
L’item Run || Exécuter
ouvre un menu qui expose plusieurs autres actions intéressantes, entre autres :
- Exécuter la/les ligne(s) d’instruction sélectionnée(s) :
Run Selected Line(s) || Exécuter la ou les Lignes sélectionnées
, raccourciCtrl+Entrée
ouCmd+Entrée
- Exécuter le chunk dans lequel le curseur se trouve en entier :
Run Current Chunk || Exécuter le Chunk actuel
que nous avons déjà mentionné - Exécuter tous les chunk précédents :
Run All Chunk Above | Exécuter tous les chunks au-dessus
- Redémarrer R et exécuter tous les chunks dans la foulée :
Restart R and Run All Chunks || Redémarrer R et exécuter tous les chunks
. Cette action est particulièrement intéressante pour s’assurer que le document est réellement reproductible ! - …
Après la phase d’édition du texte et des instructions dans les chunks, vous pouvez visualiser votre document final en cliquant sur le bouton Preview || Prévisualiser
(R Notebook), Knit || Tricoter
(R Markdown) ou Render || Rendu
(Quarto). Dans le cas du R Notebook, vous devrez obligatoirement avoir exécuté tous les chunks auparavant. Pour le Quarto ou le R Markdown, ce n’est pas nécessaire puisque leur exécution fait partie intrinsèque de la compilation du document final.
Le document final est généré avec un rendu simple et professionnel. Par défaut, ce document final présente le texte que vous avez écrit avec les résultats que vous avez choisi de générer via R, mais également les instructions que vous avez employées pour obtenir ces résultats. Ceci permet de mieux comprendre, directement dans le rapport, comment tout cela a été calculé. Il est possible de cacher le code (dans un document généré depuis un R Notebook), ou d’indiquer une directive de compilation dans les chunks pour éviter que le code ne s’imprime dans le document final. Voyez les options en cliquant sur le petit engrenage à côté de la flèche verte en haut à droite du chunk. Consultez l’aide-mémoire de R Markdown accessible à partir du menu RStudio Help -> Cheat Sheets -> Markdown Reference Guide || Aide -> Cheat Sheets -> Guide de référence de R Markdown
, voir chunk options p. 2-3 pour plus d’informations sur les nombreuses options disponibles.
Par exemple, en ajoutant la directive echo=FALSE
dans la balise d’entrée d’un chunk (```{r, echo=FALSE}
), on empêche d’imprimer le code de ce chunk dans le document final.
Notez que sur la droite du bouton Preview || Prévisualiser
(R Notebook) Knit | Tricoter
(R Markdown) ou Render || Rendu
(Quarto), vous avez un autre bouton représenté par un petit engrenage blanc. Il donne accès à un menu déroulant qui vous permet de modifier la façon de générer vos rapports. L’entrée tout en bas Output Options... || Options de sortie...
permet de paramétrer la présentation du document final.
Si vous cliquez sur la petite flèche noire pointant vers le bas juste après Preview || Prévisualiser
ou Knit || Tricoter
, vous avez un autre menu déroulant qui donne accès aux différents formats possibles : HTML, PDF, Word, etc. Essayez les différentes options pour visualiser comment votre document final se présente dans les différents formats.
En réalité, il existe deux versions de RStudio : RStudio IDE qui fonctionne en mode local, comme la plupart des logiciels que vous utilisez sur votre ordinateur, et RStudio Server qui offre quasiment la même interface à l’utilisateur, mais qui fonctionne sur une machine distante (dans SaturnCloud, par exemple). Pour des raisons de simplicité, lorsque nous indiquons “RStudio” dans le texte, cela se réfère indifféremment à ces deux moutures, sauf indication particulière et pour les fonctionnalités spécifiques à l’une ou à l’autre.↩︎
N’éditer jamais à la main un fichier
.Rproj
. Laisser RStudio s’en occuper !↩︎Vous noterez que RStudio indique
HOME || Accueil
dans l’onglet Files || Fichiers pour représenter le dossier de l’utilisateur qui est en réalité/home/sv
dans VirtualBox ou /home/jovyan
dans SaturnCloud.↩︎Dans R sous Windows, si vous utilisez les backslashs, vous devez les doubler (
~\\Documents\\...
). Ce n’est ni très esthétique, ni compatible avec les deux autres systèmes. Heureusement, nous avons déjà noté que R comprend aussi le slash comme séparateur sous Windows, de sorte que la même syntaxe peut être utilisée partout ! Nous vous conseillons donc d’utiliser également les slashs sous Windows dans R ou RStudio.↩︎Les systèmes d’édition professionnels dissocient en effet le fond de la forme : vous rédiger d’abord le contenu, et ensuite, vous indiquer le style à lui appliquer.↩︎