Apprentissage statistique


Champ disciplinaire : Méthode (Obligatoire)
Niveau : M2
Crédits : 3 ECTS



Responsable : Nicolas Desassis (Mines)
Type d’enseignement : Cours/TD
Volume horaire : 22h – 30h max



Évaluation : L’évaluation est prévue à partir d’un rapport de synthèse à rédiger sur le travail effectué en TPs (et/ou en micro-projets, selon nombre d’inscrits).


Mots Clés :
Prérequis : Notions de bases en probabilités et statistiques. Des notions sur les algorithmes numériques d’optimisation (type descente de gradient) sont utiles, mais ne sont pas du tout indispensables.

L’essor de la numérisation fait s’accumuler des masses considérables de données et d’images, induisant un besoin croissant de fouille et d’exploitation automatisée et intelligente de ces données. De nombreux algorithmes (réseaux neuronaux, SVM, dopage …) permettent des analyses et modélisations plus puissantes que les simples statistiques classiques. Le cours présente un panorama des techniques « d’apprentissage artificiel », leur cadre théorique et méthodologique commun, et divers types d’applications.

Programme

  • Théorie de l’apprentissage statistique ;
  • typologie des applications : classification, régression, prédiction, catégorisation, …
  • réseaux neuronaux (à couches, RBF, …) ;
  • méthodes à noyaux et Support Vector Machines (SVM) ;
  • dopage (boosting) ;
  • modèles graphiques probabilistes (réseaux bayésiens) ;
  • apprentissage non supervisé pour la catégorisation (k-means, cartes topologiques de Kohonen, …) ;
  • autres types d’apprentissage non supervisé (Analyse en Composantes Indépendantes pour la séparation aveugle de sources, optimisation de comportement global d’un agent « intelligent », …) ;
  • algorithmes évolutionnistes et autres méta-heuristiques.

Le cours présente succinctement les divers paradigmes et leurs types d’applications, et laisse une place importante (environ la moitié des séances) à des Travaux Pratiques permettant une mise en œuvre concrète des principales techniques présentées.