Logo ÉTS
Session
Cours
Responsable(s) Luc Duong

Se connecter
 

Sauvegarde réussie
Echec de sauvegarde
Avertissement
École de technologie supérieure

Responsable(s) de cours : Luc Duong


PLAN DE COURS

Hiver 2023
MTI805 : Compréhension de l’image (3 crédits)





Préalables
Aucun préalable requis




Descriptif du cours

Au terme de ce cours, l’étudiant ou l'étudiante sera en mesure :

  • de reconnaître les algorithmes contemporains de compréhension de l’image et de vision par ordinateur;
  • de développer un sens critique face aux différents algorithmes en compréhension de l’image et en vision par ordinateur;
  • de concevoir et implémenter des solutions de base en compréhension de l’image et en vision par ordinateur;
  • de comprendre les questions de recherche en compréhension de l’image et en vision par ordinateur.

Survol des techniques récentes en compréhension d’images et en vision par ordinateur. Manipulation, reconnaissance et interprétation de l’image 2D et 3D. Bases du traitement de l’image, principes d’interprétation de l’image, introduction au concept de caméra, transformations d’images, appariement de formes, reconnaissance de formes, détection d’objets et suivi du mouvement en 2D et en 3D, reconstruction 3D à à partir de la stéréovision et algorithmes d’apprentissage pour l’interprétation de scènes.




Objectifs du cours

À la fin de ce cours, l’étudiant(e) :

  • Connaîtra des méthodes de base de programmation en compréhension de l’image et en vision par ordinateur;
  • Connaîtra les différents algorithmes de compréhension de l’image et de vision par ordinateur;
  • Développera un sens critique face aux différents algorithmes en compréhension de l’image et en vision par ordinateur;
  • Sera capable de concevoir et implémenter des solutions de base en compréhension de l’image et en vision par ordinateur;
  • Sera initié(e) aux principales techniques de recherche et questions de recherche en compréhension de l’image et en vision par ordinateur.



Stratégies pédagogiques
  • Un (1) cours magistral par semaine.
  • Application des concepts vus en classe lors de deux (2) projets dirigés.
  • Une séance (1) de revue de la littérature dirigée.
  • Discussion en classe sur les lectures et sur les projets.
  • Un (1) projet synthèse au choix de l’étudiant.



Utilisation d’appareils électroniques

Les appareils électroniques seront tolérés en classe, conditionnellement à l'approbation du professeur. Aucun enregistrement (photographie, film ou
audio) ne sera toléré.




Horaire
Groupe Jour Heure Activité
01 Mercredi 13:30 - 17:00 Activité de cours



Coordonnées de l’enseignant
Groupe Nom Activité Courriel Local Disponibilité
01 Luc Duong Activité de cours Luc.Duong@etsmtl.ca A-4477



Cours

1. Introduction (3 heures) : 

  • Plan de cours et travaux. 
  • Définitions et concepts de base; motivations. 
  • Survol du contenu.

2. Description d’une image numérique (3 heures)

  • Représentation numérique. 
  • Mode de représentation. 
  • Format d’images. 
  • Manipulation d’image. 

3. Introduction à OpenCV (3 heures)

  • Historique d’OpenCV
  • Philosophie de programmation
  • Survol des modules
  • Normes de programmation

4. Principes d’interprétation de l’image (4.5 heures)

  • Primitive de base (détection de lignes, arêtes, cercles)
  • Descripteurs d’image invariants à la rotation, facteur d’échelle, etc.
  • Extraction de caractéristiques

5. Classification et reconnaissance d’objets (4.5 heures)

  • Analyse et apprentissage de formes
  • Classification d’objets
  • Reconnaissance d’objets

6. Apprentissage profond en vision (6 heures)

  • Réseau de neurones convolutif
  • Réseau antagoniste génératif  
  • Réseau de neurones récurrent 

7. Appariement et fusion d’images (4.5 heures)

  • Principe de stéréo correspondance
  • Fusion et recalage d’image 2D, 3D
  • Introduction à la reconstruction 3D         

8. Vision stéréo (4.5 heures)

  • Introduction au concept de caméra
  • Modèle projectif de caméra
  • Introduction à la stéréovision
  • Principe de reconstruction 3D

9. Interprétation du mouvement (3 heures)

  • Principe du mouvement
  • Algorithmes de suivi du mouvement en 2D
  • Algorithmes de suivi du mouvement en 3D

10. Neurophysiologie de la vision (3 heures)

  • Structure du cortex visuel
  • Neurophysiologie de la vision
  • Perception et modèle de reconnaissance du cerveau

 




Laboratoires et travaux pratiques

Projets dirigés : Les deux (2) projets dirigés à réaliser seul ou en équipe de deux (2) sont les suivants :

  • Projet dirigé #1 : Développer une application pour la capture de l’image à partir d’une caméra de type webcam ou d’une séquence vidéo.  Effectuer le suivi de primitives graphiques simples (contours, arêtes) dans une image. Analyser la scène ensuite pour détecter des primitives complexes (visage, mains) avec des algorithmes avancés en traitement de l’image.
  • Projet dirigé #2 : Réaliser une application de fusion d’image 2D (panorama) à partir de primitives détectées automatiquement et semi-automatiquement. Choisir une approche tirée de la littérature à étudier. 

Projet synthèse et présentation: Le projet synthèse consiste à proposer une application concrète des concepts vus au cours au choix de l’étudiant (sujet à approbation par le professeur). À chaque étape, remettre un rapport qui décrit l’approche proposée, discute la conception de l’application et montre des captures d’écran. Une présentation en classe de 10-15 minutes permettra de présenter l’approche choisie, un survol de l’application et  une critique constructive de l’approche choisie. 




Évaluation

Projets dirigés (PD) et projet synthèse : 40 % (PD1 : 10 %, PD2 : 10 % , Projet synthèse: 20 %)

Présentation orale de la revue de littérature : 10 %

Présentation orale finale : 20 %

Examen final : 30 %

 




Date de l'examen final
Votre examen final aura lieu pendant la période des examens finaux, veuillez consulter l'horaire à l'adresse suivante : http://etsmtl.ca/Etudiants-actuels/Baccalaureat/Examens-finaux


Politique de retard des travaux
Tout travail (devoir pratique, rapport de laboratoire, rapport de projet, etc.) remis en retard sans motif valable, c’est-à-dire autre que ceux mentionnés dans le Règlement des études (1er cycle, article 7.2.7 b / cycles supérieurs, article 6.5.4 b) se verra attribuer la note zéro, à moins que d’autres dispositions ne soient communiquées par écrit par l’enseignant dans les consignes de chaque travail à remettre ou dans le plan de cours pour l’ensemble des travaux.

Dispositions additionnelles

Les travaux devront être remis par courriel au professeur aux dates de remise. Une pénalité de 10 % par jour sur la note du travail sera appliquée aux travaux en retard. 




Absence à un examen
Dans les cinq (5) jours ouvrables suivant la tenue de son examen, l’étudiant devra justifier son absence d’un examen durant le trimestre auprès de la coordonnatrice – Affaires départementales qui en référera au directeur de département. Pour un examen final, l’étudiant devra justifier son absence auprès du Bureau du registraire. Toute absence non justifiée par un motif majeur (maladie certifiée par un billet de médecin, décès d’un parent immédiat ou autre) à un examen entraînera l’attribution de la note (0).



Infractions de nature académique
Les clauses du « Règlement sur les infractions de nature académique de l’ÉTS » s’appliquent dans ce cours ainsi que dans tous les cours du département. Les étudiants doivent consulter le Règlement sur les infractions de nature académique (https://www.etsmtl.ca/docs/ETS/Gouvernance/Secretariat-general/Cadre-reglementaire/Documents/Infractions-nature-academique ) pour identifier les actes considérés comme étant des infractions de nature académique ainsi que prendre connaissance des sanctions prévues à cet effet.  À l’ÉTS, le respect de la propriété intellectuelle est une valeur essentielle et les étudiants sont invités à consulter la page Citer, pas plagier ! (https://www.etsmtl.ca/Etudiants-actuels/Baccalaureat/Citer-pas-plagier).



Documentation obligatoire

Richard Szeliski (2021), Computer Vision: Algorithms and Applications, Springer. Une version préliminaire est disponible en ligne sur le site de  l'auteur. http://szeliski.org/Book/ 

Diverses lectures (par exemple, des articles scientifiques) seront imposées au cours de la session à partir des publications électroniques disponibles à la bibliothèque de l’ÉTS.




Ouvrages de références
  1. Adrian Kaehler et Gary Bradski (2017), Learning OpenCV 3: Computer Vision in C++,  Oreilly Media.
  2. Raphael Gonzalez et Richard Wood (2008), Digital Image Processing, 3ième édition, Prentice Hall.
  3. Richard Hatley et Andrew Zisserman (2004), Multiple View Geometry in Computer Vision, Cambridge University Press.
  4. David Forsyth et Jean Ponce (2002), Computer Vision: A Modern Approach, Prentice Hall.
  5. R.O. Duda, P.E. Hart, et D.G. Stork(2000),  Pattern Classification (2nd Edition), Wiley-Interscience.



Adresse internet du site de cours et autres liens utiles

cours.etsmtl.ca/mti805