MSc Data Management
Data Analysis & Machine Learning
Cours pratique couvrant l'ensemble du pipeline data science, depuis la préparation des données jusqu'à l'interprétation des modèles. Python, scikit-learn, pandas. Les étudiants conduisent un projet de bout en bout sur un dataset réel.
Machine LearningPython
Public
Étudiants en data science, futurs data analysts et data scientists
Format
30 heures
3 ECTS
Langue
Anglais
Institution
Paris School of Business
Objectifs pédagogiques
Ce que vous saurez faire à l'issue du module.
- 01Maîtriser les étapes de la préparation des données
- 02Sélectionner et entraîner un modèle de machine learning adapté
- 03Évaluer rigoureusement les performances
- 04Interpréter les résultats et communiquer aux décideurs
Programme
Le déroulé complet.
Module 01
Préparation
- ◆Exploration et nettoyage
- ◆Feature engineering
- ◆Encodage, normalisation
Module 02
Modélisation
- ◆Régression, classification, clustering
- ◆Validation croisée, hyperparamètres
- ◆Métriques par tâche
Module 03
Interprétation
- ◆Importance des variables
- ◆SHAP, LIME
- ◆Communication aux non-experts
Pédagogie
Méthode
Notebooks Jupyter, projets sur datasets réels, code review.
Évaluation
Modalités
- ◆Projet data en équipe
- ◆Notebook commenté
- ◆Soutenance
Réserver une intervention