Concepts fondamentaux (3 heures)
- Types d'apprentissage. Régularisation. Sélection de modèles. Conception d'un système intelligent. Exemples d’applications. Étude de cas. Méthodes d'évaluation de performance.
Préparation de données et extraction de primitives (3 heures)
- Le spectre de la structure. Types de variables. Préparation de données. Traitement par lots et ETL. Normalisation. Extraction de primitives. Apprentissage de la représentation. Encodage One-Hot. Exemples d'applications sur vidéo, images et audio.
Réduction de la dimensionnalité (3 heures)
- Sélection de sous-ensembles. Analyse des composantes principales (PCA). Analyse discriminante linéaire (LDA).
Théorie de la décision de Bayes et méthodes paramétriques (3 heures)
- Classification bayésienne. Pertes et risques. Fonctions discriminantes. Valeur de l’information. Classificateur optimal de Bayes. Estimation à maximum de vraisemblance. Biais et variance. Classification et régression paramétrique. Méthodes à plusieurs variables. Données à plusieurs variables. Estimation des paramètres. Classification et régression multivariée.
Méthodes non-paramétriques (3 heures)
Modèles discriminatifs linéaires (3 heures)
- Modèle linéaire. Géométrie. Descente du gradient. Discrimination logistique.
Réseaux de neurones profonds (3 heures)
- Perceptron multicouches. Algorithme de propagation rétroactive. Procédure d’entraînement. Réseaux profonds. Apprentissage de représentations. Réseaux convolutifs. Réseaux récurrents et récursifs. Autoencodeurs.
Réseaux de neurones convolutifs (3 heures)
- Neurone à convolution. Couche de regroupement. Réseaux convolutifs. Régularisation de réseaux. Réseaux récurrents et récursifs. Autoencodeurs.
Transformers (3 heures)
- Modèles séquence-à-séquence. Mechanisms d'auto-attention. Encodage positionnel. Structure encodeur-décodeur. Modèles basés sur les transformers.
Machines à vecteurs de support (3 heures)
- Hyperplan séparateur et marge maximale. Astuce du noyau. Classification par SVM. Régression par SVM. SVM à une classe. SVM multi-classe.
Combinaison de modèles d'apprentissage (3 heures)
- Génération de modèles d'apprentissage. Combinaison d'experts. Combinaison à plusieurs étages. Système de vote.
Regroupement (3 heures)
- Introduction. Mélange de densités. Regroupement k-moyennes. Algorithme de maximisation de l’espérance. Algorithmes hiérarchiques.