Logo ÉTS
Session
Cours
Responsable(s) Luc Duong

Se connecter
 

École de technologie supérieure
Département de génie logiciel et des TI
Responsable(s) de cours : Luc Duong


PLAN DE COURS

Hiver 2018
MTI805 : Compréhension de l’image (3 crédits)



Préalables
Aucun préalable requis




Descriptif du cours
Au terme de ce cours, l’étudiant sera en mesure :
• de reconnaître les algorithmes contemporains de compréhension de l’image et de vision par ordinateur;
• de développer un sens critique face aux différents algorithmes en compréhension de l’image et en vision par ordinateur;
• de concevoir et implémenter des solutions de base en compréhension de l’image et en vision par ordinateur;
• de comprendre les questions de recherche en compréhension de l’image et en vision par ordinateur.

Survol des techniques récentes en compréhension d’images et en vision par ordinateur. Manipulation, reconnaissance et interprétation de l’image 2D et 3D. Bases du traitement de l’image, principes d’interprétation de l’image, introduction au concept de caméra, transformations d’images, appariement de formes, reconnaissance de formes, détection d’objets et suivi du mouvement en 2D et en 3D, reconstruction 3D à à partir de la stéréovision et algorithmes d’apprentissage pour l’interprétation de scènes.



Objectifs du cours

À la fin de ce cours, l’étudiant(e) :

  • Connaîtra des méthodes de base de programmation en compréhension de l’image et en vision par ordinateur;
  • Connaîtra les différents algorithmes de compréhension de l’image et de vision par ordinateur;
  • Développera un sens critique face aux différents algorithmes en compréhension de l’image et en vision par ordinateur;
  • Sera capable de concevoir et implémenter des solutions de base en compréhension de l’image et en vision par ordinateur;
  • Sera initié(e) aux principales techniques de recherche et questions de recherche en compréhension de l’image et en vision par ordinateur.



Stratégies pédagogiques
  • Un (1) cours magistral par semaine.
  • Application des concepts vus en classe lors de deux (2) projets dirigés.
  • Une séance (1) de revue de la littérature dirigée.
  • Discussion en classe sur les lectures et sur les projets.
  • Un (1) projet synthèse au choix de l’étudiant.



Utilisation d’appareils électroniques

Les appareils électroniques seront tolérés en classe, conditionnellement à l'approbation du professeur. Aucun enregistrement (photographie, film ou
audio) ne sera toléré.




Horaire
Groupe Jour Heure Activité
01 Mercredi 08:45 - 12:45 Activité de cours



Coordonnées de l’enseignant
Groupe Nom Activité Courriel Local Disponibilité
01 Luc Duong Activité de cours Luc.Duong@etsmtl.ca A-4477



Cours

1. Introduction (3 heures): 

  • Plan de cours et travaux. 
  • Définitions et concepts de base; motivations. 
  • Survol du contenu.

2. Description d’une image numérique (3 heures): 

  • Représentation numérique. 
  • Mode de représentation. 
  • Format d’images. 
  • Manipulation d’image. 

3. Introduction à OpenCV (3 heures): 

  • Historique d’OpenCV
  • Philosophie de programmation
  • Survol des modules
  • Normes de programmation

4. Principes d’interprétation de l’image (4.5 heures):

  • Primitive de base (détection de lignes, arêtes, cercles)
  • Descripteurs d’image invariants à la rotation, facteur d’échelle, etc.
  • Extraction de caractéristiques

5. Classification et reconnaissance d’objets (4.5 heures):

  • Analyse et apprentissage de formes
  • Classification d’objets
  • Reconnaissance d’objets

6. Proposition du sujet du projet et de la revue de la littérature (3 heures)

7. Appariement et fusion d’images (3 heures)

  • Principe de stéréo correspondance
  • Fusion et recalage d’image 2D, 3D
  • Introduction à la reconstruction 3D         

8. Vision stéréo (3 heures)

  • Introduction au concept de caméra
  • Modèle projectif de caméra
  • Introduction à la stéréovision
  • Principe de reconstruction 3D

9. Interprétation du mouvement (3 heures)

  • Principe du mouvement
  • Algorithmes de suivi du mouvement en 2D
  • Algorithmes de suivi du mouvement en 3D

10. Neurophysiologie de la vision (3 heures)

  • Structure du cortex visuel
  • Neurophysiologie de la vision
  • Perception et modèle de reconnaissance du cerveau

11. Présentations finales en classe (6 heures)




Laboratoires et travaux pratiques

Projets dirigés: Les deux (2) projets dirigés à réaliser seul ou en équipe de deux (2) sont les suivants :

  • Projet dirigé #1 : Développer une application pour la capture de l’image à partir d’une caméra de type webcam ou d’une séquence vidéo.  Effectuer le suivi de primitives graphiques simples (contours, arêtes) dans une image. Analyser la scène ensuite pour détecter des primitives complexes (visage, mains) avec des algorithmes avancés en traitement de l’image.
  • Projet dirigé #2 : Réaliser une application de fusion d’image 2D (panorama) à partir de primitives détectées automatiquement et semi-automatiquement. Choisir une approche tirée de la littérature à étudier. 

Projet synthèse: Le projet synthèse consiste à proposer une application concrète des concepts vus au cours au choix de l’étudiant (sujet à approbation par le professeur). A chaque étape, remettre un rapport qui décrit l’approche proposée, discute la conception de l’application et montre des captures d’écran. Une présentation en classe de 10-15 minutes permettra de présenter l’approche choisie, un survol de l’application et  une critique constructive de l’approche choisie. 




Évaluation

Projets dirigées (PD) et projet synthèse : 40 % (PD1 : 10 %, PD2 : 10 % , Projet synthèse: 20 %)

Présentation orale de la revue de littérature : 10 %

Présentation orale finale : 20 %

Examen final : 30 %

 




Politique de retard des travaux
Tout travail (devoir pratique, rapport de laboratoire, rapport de projet, etc.) remis en retard sans motif valable, c’est-à-dire autre que ceux mentionnés dans le Règlement des études (1er cycle, article 7.2.7 b / cycles supérieurs, article 6.5.4 b) se verra attribuer la note zéro, à moins que d’autres dispositions ne soient communiquées par écrit par l’enseignant dans les consignes de chaque travail à remettre ou dans le plan de cours pour l’ensemble des travaux.

Dispositions additionnelles

Les travaux devront être remis par courriel au professeur aux dates de remise. Une pénalité de 10 % par jour sur la note du travail sera appliquée aux travaux en retard. 




Absence à un examen
Dans les cinq (5) jours ouvrables suivant la tenue de son examen, l’étudiant devra justifier son absence d’un examen durant le trimestre auprès de la coordonnatrice – Affaires départementales qui en référera au directeur de département. Pour un examen final, l’étudiant devra justifier son absence auprès du Bureau du registraire. Toute absence non justifiée par un motif majeur (maladie certifiée par un billet de médecin, décès d’un parent immédiat ou autre) à un examen entraînera l’attribution de la note (0).



Plagiat et fraude
Les clauses du « Règlement sur les infractions de nature académique de l’ÉTS » s’appliquent dans ce cours ainsi que dans tous les cours du département. Les étudiants doivent consulter le Règlement sur les infractions de nature académique (https://www.etsmtl.ca/A-propos/Direction/Politiques-reglements/Infractions_nature_academique.pdf ) pour identifier les actes considérés comme étant des infractions de nature académique ainsi que prendre connaissance des sanctions prévues à cet effet.  À l’ÉTS, le respect de la propriété intellectuelle est une valeur essentielle et les étudiants sont invités à consulter la page Citer, pas plagier ! (https://www.etsmtl.ca/Etudiants-actuels/Baccalaureat/Citer-pas-plagier).



Documentation obligatoire

Richard Szeliski (2010), Computer Vision: Algorithms and Applications, Springer. http://szeliski.org/Book/

Diverses lectures (par exemple, des articles scientifiques) seront imposées au cours de la session à partir des publications électroniques disponibles à la bibliothèque de l’ÉTS.




Ouvrages de références
  1. Gary Rost Bradski et Adrian Kaehler (2013), Learning OpenCV : Computer Vision in C++ with the OpenCV Library,  Oreilly Media.
  2. Raphael Gonzalez et Richard Wood (2008), Digital Image Processing, 3ième édition, Prentice Hall.
  3. Richard Hatley et Andrew Zisserman (2004), Multiple View Geometry in Computer Vision, Cambridge University Press.
  4. David Forsyth et Jean Ponce (2002), Computer Vision: A Modern Approach, Prentice Hall.
  5. R.O. Duda, P.E. Hart, et D.G. Stork(2000),  Pattern Classification (2nd Edition), Wiley-Interscience.



Adresse internet du site de cours et autres liens utiles

cours.etsmtl.ca/mti805