Module 1 Introduction & visualisation I
Objectifs
Se familiariser avec les outils logiciels de base pour la science des données (SciViews Box, RStudio, logiciel R](https://www.r-project.org) (R Core Team 2024), GitHub, Git).
Réaliser son premier document écrit en Quarto/R Markdown (Allaire et al. 2024) (entête YAML, zones Markdown et chunks de code).
Être capable de réaliser différentes variantes d’un graphique en nuage de points dans R avec la fonction
chart()
Intégrer ensuite des graphiques dans un rapport et y décrire ce que vous observez
Les liens cliquables qui vous sont proposés dans ce cours ont été spécialement sélectionné pour vous. La section Prérequis vous permet de vous assurer que vous avez toutes les connaissances nécessaires pour aborder le module dans les meilleures conditions possibles.
Cliquez sur ces liens
Prérequis
La partie suivante est repliée. Il s’agit d’une partie optionnelle, mais néanmoins indispensable pour réaliser les exercices de ce cours qui vont être effectués sur ordinateur.
Si vous considérez que vous maîtrisez les éléments de base d’un ordinateur, le clavier, que vous êtes capables de trouver toute une série de caractères, dont des caractères spéciaux et des raccourcis clavier, vous pouvez sauter cette partie repliée et continuer votre lecture. En cas d’hésitation, dépliez la partie afin d’approfondir vos connaissances.
Élément de base d’un ordinateur et des navigateurs web
Un ordinateur peut sembler être un outil simple et familier. Il est pourtant bien plus complexe qu’il n’y parait.
- Gestion des comptes sur votre ordinateur
Il n’est pas rare d’avoir un ordinateur qui soit utilisé par plusieurs personnes. Pour que chaque utilisateur puisse avoir un espace personnel dédié, vous allez devoir créer plusieurs comptes. Vous retrouvez la procédure pour Windows et pour macOS. Chaque type de compte ne se vaut pas. Le compte administrateur est le compte qui a le plus de droits sur un ordinateur. Il faut, par exemple, avoir les droits d’un compte administrateur pour pouvoir installer la plupart des logiciels. Si plusieurs étudiants utilisent un même ordinateur, vous devez obligatoirement créer des comptes séparés, sans quoi l’activité des différents utilisateurs ne pourra pas être discriminée et votre progression ne sera pas enregistrée correctement !
- Organisation des fichiers sur un ordinateur
Votre ordinateur contient un ou plusieurs disques durs. Une arborescence de dossiers va être mise en place pour ranger les fichiers dans chaque disque dur. On peut se représenter chaque disque comme une armoire avec des tiroirs. Les principaux dossiers sont le dossier bureau
(desktop), documents
(documents) ou encore téléchargements
(downloads). Vous devez comprendre les bases de l’organisation des dossiers et des fichiers dans votre ordinateur, ainsi que leur manipulation à l’aide de l’explorateur de fichiers (Windows) ou du Finder (macOS) avant d’aborder le présent module.
- Terminologie de base
Lorsque vous travaillez sur un ordinateur, vous interagissez avec un certain nombre d’éléments dont il est important de connaitre le nom. Si vous n’êtes pas familier avec cette terminologie, voyez les éléments qui composent un ordinateur et les pages suivantes qui sont proposées si nécessaire. Imprégnez-vous aussi du vocabulaire de base ou encore ici.
- Raccourcis clavier
Les raccourcis clavier vous permettent d’optimiser votre productivité. Prenez un peu de temps pour vérifier que vous en connaissez les principaux via ces pages : pour Windows, pour macOS ou encore pour Linux Ubuntu. Les raccourcis clavier ne sont pas indispensables, mais ils vous feront gagner du temps lors des exercices, cela peut être très utile lorsque le temps est limité.
- Captures d’écran
Lorsque vous rencontrez un problème avec votre ordinateur ou un de ses logiciels, une capture d’écran bien réalisée permet souvent d’illustrer utilement votre question sur un forum et peut remplacer une longue explication textuelle. Vous pouvez retrouver des tutoriels pour réaliser une capture d’écran dans Windows ou dans macOS. Le plus important est de cibler la zone à capturer. Il est donc bien souvent inutile de sélectionner tout le bureau de l’ordinateur, voire toute la fenêtre de l’application. Dans les cours de science des données, vous serez amené à poser des questions et à illustrer vos propos à l’aide de copies d’écran. Vous êtes supposé capable de le faire. Les photos d’écran prises à l’aide d’un smartphone ne sont pas acceptables, car elles sont toujours bien moins lisibles que la copie directe de l’écran avec les outils ad hoc.
Rappel : lorsque vous voyez le petit logo “H5P” comme ci-dessous, cela signifie que vous avez maintenant un exercice interactif. Cet exercice peut prendre différentes formes (quiz, présentation ou vidéo contenant des questions, vrais ou faux, cliquer sur une image…).
- Navigateurs Web
Un navigateur Web est un logiciel qui permet d’accéder au Web. Le Web n’est pas un synonyme d’Internet comme vous pouvez le lire dans la formation comprendre le Web d’Open Classroom. Les navigateurs Web principaux sont Google Chrome, Microsoft Edge, Mozilla Firefox ou encore Safari sous macOS. Pour ce cours en ligne, vous allez devoir naviguer sur le Web et utiliser divers outils comme RStudio Server qui sont accessibles depuis une page Web. Par conséquent, vous devez être capable d’utiliser un navigateur Web pour afficher des pages, effectuer une recherche, créer une liste de “bookmarks”, etc. Chaque navigateur Web a ses particularités et les pages que vous utiliserez ne fonctionnent pas forcément toutes avec ces différents navigateurs. Nous ne pouvons pas les tester avec toutes les options possibles (type de navigateur, version et système Windows, macOS ou Linux, cela fait énormément de combinaisons possibles). Par conséquent, nous sommes obligés de restreindre la liste des navigateurs Web utilisables pour le cours à la version la plus récente de Google Chrome (tous systèmes), Edge (Windows), Safari (macOS) ou Chromium (Linux). Les autres (Firefox, Opera, Brave, Vivaldi, Internet Explorer, etc.) sont à éviter, car non testés ou incompatibles. Firefox en particulier, ne fonctionne pas avec différentes pages du cours, et de GitHub, entre autres.
L’objectif principal de ce module est de réaliser des graphiques en nuage de points. Il est de ce fait important de maîtriser des éléments de géométrie (origine, abscisse, ordonnée, coordonnées d’un point dans un plan) mais également des fonctions mathématiques comme les puissances et les logarithmes. Vous trouverez une nouvelle partie repliée juste après l’exercice ci-dessous pour vous rafraîchir la mémoire concernant ces notions.
À vous de jouer !
Le graphique ci-dessous présente la variation de la hauteur du test en fonction de la masse d’oursins (n’hésitez à faire des petites recherches par vous-même, si vous ne savez pas ce qu’est le “test” d’un oursin).
Notions élémentaires de géométrie et de fonctions mathématiques
Les éléments de base de la géométrie suivants sont indispensables pour ce cours : origine, abscisse, ordonnée, coordonnées d’un point dans un plan…
Vous devez maîtriser les notions suivantes : les puissances, les logarithmes, dont le logarithme népérien et les exponentielles.
Le préambule de ce cours vous a également permis d’en apprendre davantage sur le matériel pédagogique, l’approche pédagogique ou encore la méthode d’évaluation. Vérifiez votre compréhension des notions vues avec l’exercice suivant.
À vous de jouer !
Note : les tutoriels learnrs vous permettent d’autoévaluer l’acquis de connaissances et de compétences. Dans le cours, ils sont marqués d’une icône en forme de toque verte. Ils s’exécutent directement dans RStudio à l’intérieur de la SciViews Box (dans SaturnCloud). Vous copiez l’instruction BioDataScience1::run("A00La_discovery")
et la collez dans l’onglet Console de RStudio. Ensuite, vous validez la commande en cliquant sur la touche <entrée> et le tutoriel doit se lancer. Vous pouvez ouvrir ensuite le tutoriel dans sa propre fenêtre plus spacieuse en cliquant sur le second bouton de la barre d’outils en forme de petite fenêtre avec une flèche blanche.
Effectuez maintenant les exercices du tutoriel A00La_discovery (Découverte de learnr).
BioDataScience1::run("A00La_discovery")
Vous pouvez aussi voir (ou revoir) les dias de la présentation qui vous est faite en séance introductive.