Version PDF

Afficher les cours préalables

Afficher les qualités de l'ingénieur

École de technologie supérieure

Responsable(s) de cours :

Jose Dolz

PLAN DE COURS

Automne 2025
MTI865 : Apprentissage profond pour la vision par ordinateur (3 crédits)

Préalables
Aucun préalable requis

Descriptif du cours
Ce cours vise à décrire tous les détails du fonctionnement des réseaux de neurones profonds et leurs applications dans le domaine de la reconnaissance visuelle.

Au terme de ce cours, les étudiantes et les étudiants seront en mesure d’expliquer en détail le fonctionnement des réseaux de neurones convolutifs; de discuter des avantages et inconvénients de ces approches pour des applications en vision par ordinateur; de construire des systèmes basés sur des réseaux de neurones convolutifs et les utiliser pour créer des applications.

Introduction à l'apprentissage machine, rappels d'algèbre linéaire et de calcul différentiel, perceptron et son apprentissage, réseau de neurones et son apprentissage, fonctions d'activation, propagation avant et propagation arrière, problèmes de l'apprentissage, régularisation, fonctions de coût, problèmes avec les gradients, apprentissage semi-supervisé, apprentissage faiblement supervisé, autoapprentissage, classification d'images, segmentation d'images, interprétabilité des prédictions, apprentissage en continu.

Objectifs du cours

L'objectif du cours est de comprendre tous les détails du fonctionnement des réseaux de neurones profonds et leurs applications dans le domaine de la reconnaissance visuelle.

Plus précisément, à la fin de ce cours, les étudiants seront capables de :

comprendre en détail le fonctionnement des réseaux de neurones convolutifs,
discuter des avantages et inconvénients de ces approches pour des applications en vision par ordinateur,
construire un système basé sur des CNNs et les utiliser pour créer leurs propres applications,
d'utiliser les outils appropriés pour valider et évaluer la performance de ces systèmes.

Les thèmes suivants seront abordés :

introduction à l'apprentissage machine, rappels d'algèbre linéaire et de calcul différentiel, perceptron et son apprentissage, réseau de neurones et son apprentissage, fonctions d'activation, propagation avant et propagation arrière, problèmes de l'apprentissage, régularisation, fonctions de coût, problèmes avec les gradients, apprentissage semi-supervisé, apprentissage faiblement supervisé, auto-apprentissage, classification d'images, segmentation d'images, interpretabilité des predictions, apprentissage en continue.

Stratégies pédagogiques

Trois heures et demie (3h ½) heures de cours par semaine. Dans la première partie de chaque séance, des aspects théoriques seront abordés. La deuxième partie servira pour montrer des exemples pratiques (c.à.d, implémentation) qui visent l'assimilation des notions vues au cours. Certains documents pertinents au cours (mémos, exercices, solutionnaires, énoncés de travaux, fichiers d'exemples, etc.) seront placés régulièrement sur le site Web du cours. Il est de la responsabilité de l'étudiant(e) de consulter régulièrement ce site.

Utilisation d’appareils électroniques

Puisque le cours aura un partie pratique, les ordinateurs sont permis lors de l'enseignement magistral.

Aucun enregistrement (photographie, film ou audio) n'est permis sans permission préalable de l'enseignant.

Horaire

Groupe	Jour	Heure	Activité
01	Vendredi	13:30 - 17:00	Activité de cours

Coordonnées du personnel enseignant le cours

Groupe	Nom	Activité	Courriel	Local	Disponibilité
01	José Dolz	Activité de cours	Jose.Dolz@etsmtl.ca	A-3417

Cours

Cette section présente le plan de cours prévu. Il est à noter que le contenu des thématiques abordées peut légèrement changer au cours du trimestre. Référez-vous au site web du cours (Moodle) pour les documents à jour.

A - INTRODUCTION

1 - Introduction (3 heures)

Présentation des types de problèmes classiques de vision par ordinateur (classification, détection, segmentation)

Définition de l’apprentissage machine
Contexte historique
Applications
Organisation du cours
Introduction à python/numpy

B - APPRENTISSAGE

2 - Rétropropagation (3 heures)

Descente de gradient
Règle de dérivation en chaîne
Rétropropagation, apprentissage en suivant le gradient
Réseaux de neurones en python I (Descente de gradient)

3 - Optimization (3 heures)

Fonction de coût
Optimiseurs (SGD, Momentum, Nesterov, Adam, etc.)
Réseaux de neurones en python (descente de gradient, descente de gradient stochastique, choix de l'optimiseur)

4 - Réseaux de neurones convolutifs : Mise en place de l'architecture (3 heures)

Notions/éléments de base : convolutions 2D/3D, pooling, padding, convolutions strided/dilated
Fonctions d’activation
Exemple de CNN simple
Introduction à pyTorch et création d’un CNN simple. (ex. Classification MNIST)

5 - Réseaux de neurones convolutifs : Babysitting le processus d’apprentissages (3 heures)

Régularisation (normes L1 et L2, drop-out)
Normalisation par lot
Initialization de poids (aléatoire, zéro, Xavier)
Pré-traitement de données.
Techniques pour améliorer les réseaux de neurones (augmentation de données, réglages des hyperparamètes, apprentissage par transfert et par ensemble)

C - APPLICATIONS

6 - Classification d'images (3 heures)

Introduction à la tâche de classification
CNNs pour classification
Métriques d’évaluation
Fonctions de coût pour la classification
Défis de la tâche
Étude de cas : Classification avec ImageNet

7,8 - Segmentation d'images (6 heures)

Introduction à la tâche de segmentation
CNNs pour segmentation (2D/3D)
Métriques d’évaluation
Fonctions de coût pour la classification
Défis de la tâche
Étude de cas : Segmentation d’images médicales ou des images de la conduite autonome

9 - Apprentissage faiblement supervisé (3 heures)

Apprentissage supervisé versus apprentissage faiblement supervisé
A prioris (a priori axé sur la connaissance, a priori axé sur les données)
Modèles et optimisation
Étude de cas : fonction de coût basée sur la taille

10 - Apprentissage semi-supervisé (3 heures)

Contexte
Comment utilisons-nous les données non étiquetées?
- Pseudo-masques
- Auto-apprentissage
- Co-apprentissage
Étude de cas : self-training avec des tâches auxiliaires

11 - Visualisation et interprétabilité (3 heures)

Visualisation des filtres
Visualisation des activations
Visualisation des caractéristiques (montée de gradient, DeepDream)
Exemples antagonistes (Adversarial exemples)
Transfert de style
Cartes de salliance
Cartes d'activations de la classification

Étude de cas : Interprétabilité des prédictions de classification (classification activation maps).

12 - Modélisation de l'incertitude (3 heures)

Compréhension de l'incertitude dans les prédictions
Fonctions de coût pour modéliser l'incertitude (perte de focalisation, lissage des étiquettes, MbLS, etc.)
Métriques d'évaluation
Classification vs Segmentation
Étude de cas : Limitations de l'incertitude dans l'apprentissage - segmentation

13 - Sujets avancés (3 heures)

À définir avec les étudiants à la séance 5 ou 6. Exemples : adaptation de domaines, apprentissage continue, estimation de l'incertitude des prédictions, distillation des connaissances, détection non-supervisé d'anomalies, etc.
Présentations des travaux.

L'ordre et le contenu peut être modifié en cours de session en fonction de circonstances particulières.

Laboratoires et travaux pratiques

Projet de session

Le projet de session consiste à la participation dans un challenge relié aux thèmes vus dans le cours et la présentation du travail.
Ce projet devra être effectué en équipe de 3 ou 4 et une partie de la dernière séance de la session sera consacrée à vos présentations.

Projet de recherche		20 %
Rapport		10 %
Présentation		5 %
Résultats de la competition		5 %

Évaluation

En équipe :

Projet de session (Challenge) et présentation : 20 %

Individuellement (80 %) :

Intra : 40 %
Final : 40 %

Une moyenne inférieure à 50% dans les évaluations individuelles entraîne automatiquement un échec au cours. Ceci est une condition nécessaire mais non suffisante pour réussir ce cours

Double seuil
Note minimale : 50

Dates des examens intra

Groupe(s)	Date
1	24 octobre 2025

Date de l'examen final
Votre examen final aura lieu pendant la période des examens finaux, veuillez consulter l'horaire à l'adresse suivante : https://www.etsmtl.ca/programmes-et-formations/horaire-des-examens-finaux

Politique de retard des travaux
Tout travail (devoir pratique, rapport de laboratoire, rapport de projet, etc.) remis en retard sans motif valable, c’est-à-dire autre que ceux mentionnés dans le Règlement des études (1er cycle, article 7.2.5/ cycles supérieurs, article 6.5.2) se verra attribuer la note zéro, à moins que d’autres dispositions ne soient communiquées par écrit par l’enseignante ou l’enseignant dans les consignes de chaque travail à remettre ou dans le plan de cours pour l’ensemble des travaux.

Dispositions additionnelles

Les dates de remise des travaux doivent être respectées. Une pénalité de 20 % par jour de retard sera applicable aux travaux qui ne sont pas remis à temps.

Absence à une évaluation

Afin de faire valider une absence à une évaluation en vue d’obtenir un examen de compensation, l’étudiante ou l’étudiant doit utiliser le formulaire prévu à cet effet dans son portail MonÉTS pour un examen final qui se déroule durant la période des examens finaux ou pour tout autre élément d’évaluation surveillé de 15% et plus durant la session. Si l’absence concerne un élément d’évaluation de moins de 15% durant la session, l’étudiant ou l’étudiante doit soumettre une demande par écrit à son enseignante ou enseignant.

Toute demande de validation d’absence doit se faire dans les cinq (5) jours ouvrables suivant la tenue de l’évaluation, sauf dans les cas d’une absence pour participation à une activité prévue aux règlements des études où la demande doit être soumise dans les cinq (5) jours ouvrables avant le jour de départ de l’ÉTS pour se rendre à l’activité.

Toute absence non justifiée par un motif majeur (voir articles 7.2.6.1 du RÉPC et 6.5.2 du RÉCS) entraînera l’attribution de la note zéro (0).

Infractions de nature académique
Les clauses du « Règlement sur les infractions de nature académique de l’ÉTS » s’appliquent dans ce cours ainsi que dans tous les cours du département. Les étudiantes et les étudiants doivent consulter le Règlement sur les infractions de nature académique (www.etsmtl.ca/a-propos/gouvernance/secretariat-general/cadre-reglementaire/reglement-sur-les-infractions-de-nature-academique) pour identifier les actes considérés comme étant des infractions de nature académique ainsi que prendre connaissance des sanctions prévues à cet effet. À l’ÉTS, le respect de la propriété intellectuelle est une valeur essentielle et tous les membres de la communauté étudiante sont invités à consulter la page Citer, pas plagier ! (www.etsmtl.ca/Etudiants-actuels/Baccalaureat/Citer-pas-plagier).

Systèmes d’intelligence artificielle générative (SIAG)
L’utilisation des systèmes d’intelligence artificielle générative (SIAG) dans les activités d’évaluation constitue une infraction de nature académique au sens du Règlement sur les infractions de nature académique, sauf si elle est explicitement autorisée par l’enseignante ou l’enseignant du cours.

Documentation obligatoire

Aucune documentation obligatoire. Les notes de cours seront écrites au tableau et sont la seule documentation nécessaire pour le cours.

Ouvrages de références

Livres

Bishop, C., Pattern Recognition and Machine Learning. 2006 Feb;128(9)
Lay, D.C., 2003. Linear algebra and its applications 2003 (5th edition).
Nielsen, M.A., 2015. Neural networks and deep learning (Vol. 2018).

Articles

À donner dans le cours.

Adresse internet du site de cours et autres liens utiles

Moodle : https://ena.etsmtl.ca/