3.5 Challenge
Vous avez dû apprendre beaucoup de techniques complémentaires pour arriver à entraîner correctement votre classifieur (différents algorithmes, validation croisée, matrice de confusion, métriques, courbes ROC, …). Nous vous proposons maintenant de mettre tout cela en application sous la forme d’un challenge. Vous allez travailler par équipes en binômes et vous tenterez de créer le meilleur classifieur pour détecter les vins excellents parmi un ensemble de vins de toutes catégories. Mais attention, l’exercice n’est pas facile. Vous allez devoir ruser pour gagner des places dans le classement, et mettre en œuvre toutes les techniques étudiées dans les modules 1 à 3 pour arriver aux meilleurs résultats !
À vous de jouer !
Relevez ce challenge par groupe: C03Ca_ml_wine.
Challenge en groupe de 2 pour les étudiants inscrits au cours de Science des Données Biologiques III à l’UMONS à terminer avant le 2022-11-09 18:00:00.
Initiez le projet GitHub Classroom de ce challenge
Voyez les explications dans le fichier README.md
.
Vous n’êtes pas correctement enregistré pour ce cours. Vous ne pouvez pas participer à ce challenge. Si vous êtes étudiant•e de l’UMONS, vérifiez que vous vous êtes bien enregistré•e via Moodle…
Vous pouvez soumettre vos résultats pendant une période de temps précise via l’application ci-dessous :
Cliquez pour visualiser le classement.
Pour en savoir plus
Un résumé de la classification supervisée sur un ton un peu humoristique (en anglais).
Un ouvrage complet consacré au “machine learning” dans R, en anglais. Cet ouvrage est excellent pour progresser en classification supervisée avec R.
Tidymodels, un écosystème complet de packages R pour modéliser des données, dont la classification supervisée.
mlr3, un autre écosystème logiciel pour le “machine learning avec R”
Tutoriels pour l’apprentissage profond avec R en utilisant tensorflow, une librairie de fonctions dédiée au “deep learning”.