3.5 Challenge
Vous avez dû apprendre beaucoup de techniques complémentaires pour arriver à entraîner correctement votre classifieur (différents algorithmes, validation croisée, matrice de confusion, métriques, courbes ROC…). Nous vous proposons maintenant de mettre tout cela en application sous la forme d’un challenge. Vous allez travailler individuellement et vous tenterez de créer le meilleur classifieur pour détecter les vins excellents parmi un ensemble de vins de toutes catégories. Mais attention, l’exercice n’est pas facile. Vous allez devoir ruser pour gagner des places dans le classement, et mettre en œuvre toutes les techniques étudiées dans les modules 1 à 3 pour arriver aux meilleurs résultats !
À vous de jouer !
Relevez le challenge C03Ca_ml_wine.
Challenge individuel pour les étudiants inscrits au cours de Science des Données Biologiques III à l’UMONS à terminer avant le 2024-11-06 18:00:00.
Initiez le projet GitHub Classroom de ce challenge
Voyez les explications dans le fichier README.md
.
Vous n’êtes pas correctement enregistré pour ce cours. Vous ne pouvez pas participer à ce challenge. Si vous êtes étudiant•e de l’UMONS, vérifiez que vous vous êtes bien enregistré•e via Moodle…
Vous pouvez soumettre vos résultats pendant une période de temps précise via l’application ci-dessous :
Cliquez pour visualiser le classement.
Pour en savoir plus
Un résumé de la classification supervisée sur un ton un peu humoristique (en anglais).
Un ouvrage complet consacré au “machine learning” dans R, en anglais. Cet ouvrage est excellent pour progresser en classification supervisée avec R.
Tidymodels, un écosystème complet de packages R pour modéliser des données, dont la classification supervisée.
mlr3, un autre écosystème logiciel pour le “machine learning avec R”
Tutoriels pour l’apprentissage profond avec R en utilisant tensorflow, une librairie de fonctions dédiée à l’apprentissage profond.
Torch for R, une autre librairie de fonctions dédiée à l’apprentissage profond (torch est réputé pour être plus facile et plus intuitif que Tensorflow). En anglais.