Logo ÉTS
Session
Cours
Responsable(s) Tony Wong

Se connecter
 

Sauvegarde réussie
Echec de sauvegarde
Avertissement
École de technologie supérieure

Responsable(s) de cours : Tony Wong


PLAN DE COURS

Hiver 2021
GOL717 : Conception de systèmes prédictifs pour l’entreprise (3 crédits)


Modalités de la session d’hiver 2021


Pour assurer la tenue de la session d’hiver 2021, les modalités suivantes seront appliquées :


La plupart des cours de la session d'hiver seront donnés à distance. Les autres seront donnés en présence si la situation socio-sanitaire le permet. Cette information est disponible sur l’horaire de la session d’hiver diffusé sur le site de l’ÉTS ainsi que sur Cheminot.

L’étudiant inscrit à un cours à distance doit avoir accès à un ordinateur, un micro, une caméra et un accès à internet, idéalement de 10Mb/s ou plus. L’étudiant doit ouvrir sa caméra et/ou son micro lorsque requis, notamment pour des fins d’identification ou d’évaluation.


Les cours à distance pourraient être enregistrés, à la discrétion de l’ÉTS, afin de les rendre disponibles aux étudiants inscrits aux cours.


La notation des cours sera la notation régulière prévue aux règlements des études de l'ÉTS.


Les examens intra se feront normalement à distance. Les examens finaux se feront normalement en présence si la situation socio-sanitaire le permet.


Pour les examens (intra, finaux) qui devaient se faire à distance, leur surveillance se fera à l’aide de la caméra et du micro de l’ordinateur et pourrait être enregistrée. Ceci est nécessaire pour se conformer aux exigences du Bureau canadien d’agrément des programmes de génie (BCAPG) afin d’assurer la validité des évaluations.

Le contexte actuel oblige bien sûr l’ÉTS à suivre de près l’évolution de la pandémie de COVID-19, laquelle pourrait entraîner, avant ou après le début de la session d’hiver 2021, un resserrement des directives et recommandations gouvernementales. Nous vous assurons que l’ÉTS se conformera aux règles en vigueur afin de préserver la santé publique et que, si requis, elle pourrait aller jusqu’à interdire l’accès physique au campus universitaire et ordonner que toutes les activités d’enseignement et d’évaluation soient exclusivement données à distance pour tout ou partie de la session d’hiver 2021.

Des exigences additionnelles pourraient être spécifiées par l’ÉTS ou votre département, suivant les particularités propres à votre programme.

En vous inscrivant ou en demeurant inscrit, vous acceptez les modalités particulières de la session d’hiver 2021.


Nous vous rappelons que vous avez jusqu’au 17 janvier 2021 pour vous désinscrire de vos cours et être remboursé.


Pour les nouveaux étudiants inscrits au programme de baccalauréat uniquement, vous avez jusqu’au 31 janvier 2021 pour vous désinscrire de vos cours et être remboursé.




Préalables
Programme(s) : 7095,7495
             
  Profils(s) : Tous profils  
             
    MAT350    
             
Unités d'agrément
Total d'unités d'agrément : 58,8 33,0 % 67,0 %




Qualités de l'ingénieur

Qn
Qualité visée dans ce cours  
Qn
  Qualité visée dans un autre cours  
  Indicateur enseigné
  Indicateur évalué
  Indicateur enseigné et évalué



Descriptif du cours

À la fin de ce cours, l’étudiant sera en mesure de concevoir des systèmes prédictifs destinés aux entreprises de production de biens et services. L’environnement moderne de production exige des solutions qui anticipent l’évolution du marché tout en identifiant les paramètres qui contribuent à l’amélioration de la productivité. Les systèmes prédictifs permettent la prédiction des résultats futurs en évaluant des ensembles de données historiques et transactionnelles.

Conception par intégration et adaptation : méthode factorielle, méthode de transformation orthogonale, correspondances multiples, modèle régressif, apprentissage par arbre de décision. Technologies de classification automatique : naïve Bayes, K plus proches voisins, réseaux de neurones et machines à vecteurs de support.

Critères de conception : méthodes d’apprentissage supervisé et non supervisé. Sur-apprentissage et sous-apprentissage. Apprentissage paramétrique et non paramétrique. Apprentissage profond.

Séances de laboratoire axées sur la conception de systèmes prédictifs pour le secteur manufacturier et des services. Création d’outils de prédiction par la sélection et l’adaptation et l’extension des techniques vues en classe.




Objectifs du cours

Les séances de cours et de laboratoire seront dédiées à la conception et à l’application de solutions utilisant les technologies d’analyse de données et d’apprentissage automatique. Cette approche permettra aux étudiants d’apprendre et d’appliquer les étapes de conception dans la réalisation de systèmes prédictifs orientés vers les besoins de l’entreprise. Plus spécifiquement, au terme de ce cours, les étudiants devront être capables :

  • De réaliser différentes analyses exploratoires multidimensionnelles avec des données numériques et nominales;
  • De reconnaître les éléments d’un système prédictif;
  • De réaliser les interconnexions logiques entre l’analyse de données et l’apprentissage automatique;
  • D’adapter ces technologies de l’intelligence artificielle au secteur manufacturier et des services;
  • De concevoir des systèmes prédictifs à l’aide d’une plateforme infonuagique;
  • De déployer ces systèmes prédictifs.



Stratégies pédagogiques

39           heures de cours

24           heures de laboratoires

3 heures de travail personnel par semaine

 

La lecture et la compréhension des notes de cours est obligatoire pour la réussite de ce cours.

 

Trois (3) heures de cours par semaine. Les séances de cours sont des moments privilégiés pour présenter et expérimenter différentes techniques de conception. Les difficultés rencontrées et les approches de contournement seront discutées afin d’identifier les solutions les plus efficientes.

 

Deux (2) heures de laboratoire par semaine serviront à poursuivre l’expérimentation et l’application des techniques de conception. Les solutions identifiées en classe seront déployées. Les résultats obtenus seront analysés et discutés.

 




Utilisation d’appareils électroniques

Pas d'enregistrement audio/vidéo sans autorisation de l'enseignant.




Horaire
Groupe Jour Heure Activité
01 Mercredi 18:00 - 21:30 Activité de cours
Jeudi 18:00 - 20:00 Laboratoire



Coordonnées de l’enseignant
Groupe Nom Activité Courriel Local Disponibilité
01 Tony Wong Activité de cours Tony.Wong@etsmtl.ca A-3633
01 Michel Rioux Activité de cours Michel.Rioux@etsmtl.ca A-3630
01 Tony Wong Laboratoire Tony.Wong@etsmtl.ca A-3633
01 Michel Rioux Laboratoire Michel.Rioux@etsmtl.ca A-3630



Cours
Section Sujets traités Heures

1

 

Analyse de données - préliminaire
  • Introduction au cours (contexte, références, matière couverte)
  • Rappel: quelques éléments d'algèbre linéaire et de statistique
    • Transformation linéaire;
    • Valeurs propres et vecteur propres;
    • Matrices semi-définie positive;
    • Variance, covariance et corrélation;
    • Matrice de covariance.
  • Éléments de base en analyse de données
    • Données centrées et réduites;
    • Nuages des individus;
    • Nuage des variables.

Ces concepts et notions seront utilisés dans toutes les autres sections de ce cours.

Les applications numériques seront effectuées avec Excel à l'aide du complément d'algèbre linéaire matrix.xla.

3

6 janvier

M. Rioux

2

Analyse en composantes principales (ACP)
  • But et contexte d'application;
  • Étude des individus;
  • Étude des variables;
  • Liens entre les deux études;
  • Individus et variables supplémentaires;
  • Applications numériques.

Techniques d'interprétation des résultats

  • Projection des individus dans l'espace des variables;
  • Projection des variables dans l'espace des individus;
  • Qualité de représentation Cos2;
  • Contribution des individus - des variables;
  • Cercle de corrélation.

Les applications numériques seront effectuées avec Stagraphics et R.

3

13 janvier

M. Rioux

3

Analyse factorielle des correspondances (AFC)
  • But et contexte d'application;
  • Test de l'indépendance du khi carré;
  • Étude des profils-lignes;
  • Étude des profils-colonnes
  • Liens entre les deux études;
  • Effet Guttman;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Les applications numériques seront effectuées avec Stagraphics et R.

3

20 janvier

M.Rioux

4 Analyse (factorielle) des correspondances multiples (ACM)
  • But et contexte d'application;
  • Tableau disjonctif complet des données;
  • AFC sur le tableau disjonctif complet;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Les applications numériques seront effectuées avec Stagraphics et R.

3

27 janvier

M. Rioux

5 Classification hiérarchique et partitionnement
  • But et contexte d'application;
  • Notions de ressemblance;
  • Utilité du partitionnement et de la classification hiérarchique en analyse factorielle;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Détermination du nombre de classes.

Les applications numériques seront effectuées avec Stagraphics et R.

3

3 février

M. Rioux

6

Modèles classiques de régression

  • But et contexte d'application;
  • Régression multiple;
  • Régression logistique;
  • Analyse discriminante;
  • Exemples numériques.

Les applications numériques seront effectuées avec Stagraphics et R.

3

10 février

M. Rioux

7 INTRA

3

17 février

M. Rioux

7

Modèles prédictifs - préliminaire
  • Apprentissage et validation;
  • Données pour l'apprentissage et validation;
  • Caractéristiques et cibles;
  • Généralisation, précision et justesse;

Microsoft Azure ML

  • Compte Azure et son portail;
  • Création d'un espace de travail;
  • Azure ML Studio (classic);
  • Exemple d'utilisation
    • Jeu de données;
    • Modules;
    • Paramètres des modules;
    • Expériences;
    • Modèles prédictifs;
    • Apprentissage et évaluation.

La conception et l'application des modèles prédictifs se feront à l'aide d'Azure Machine Learning (classic) un environnement infonuagique de Microsoft.

3

03 mars

T. Wong

8

Modèles prédictifs et mesures de performance

Modèles

  • Arbres et forêt d'arbres décisionnels;
  • Naïve Bayes;
  • K-means;
  • Machines à vecteurs de support.
  • Réseaux de neurones;
  • Apprentissage profond.

Mesures

  • Justesse;
  • Perte logistique;
  • AUC ROC;
  • Matrice de confusion
  • MAE, MSE.

6

10 - 17 mars

T. Wong

9

Étapes de conception
  • Préparation du jeu de données;
  • Apprentissage du modèle prédictif:
    • Hold out;
    • Validation croisée.
  • Évaluation du modèle prédictif;
  • Test du modèle prédictif;
  • Déploiement du modèle prédictif sous forme d'un service WEB;
  • Test du service WEB.

Les étapes de conception seront présentés à l'aide d'Azure Machine Learning (classic) un environnement infonuagique de Microsoft.

6

24 - 31 mars

T. Wong

10

Conception de solutions
  • Prédire le désabonnement des clients;
  • Segmentation de la clientère;
  • Détection d'anomalie;
  • Intégration avec Power BI.

3

07 avril

T. Wong

  Total 39



Laboratoires et travaux pratiques

Durant les séances de laboratoire, les étudians doivent oeuvrer, au sein d’une équipe, dans des scénarios de conception, realisation et implantation intégrant les technologies en analyse de données et en apprentissage automatique. Ils doivent appliquer et comparer la performance des modèles prédictifs conçus pour répondre aux besoins des organisations et entreprises.




Utilisation d'outils d'ingénierie
  • Microsoft Excel;
    • matrix.xla;
  • Statgraphics;
  • R et RStudio;
    • FactoMineR, Factoshiny, factoextra et FactoInvestigate;
  • Microsoft Machine Learning Studio;
  • Microsoft Power BI.



Évaluation
Activité Description %
Devoir #1

Sur l'ensemble des six premiers cours.

25
Intra Sur l'ensemble des six premiers cours. 25
Labos Sur l'ensemble des six derniers cours. 20
Final L'examen final est d’une durée de trois heures avec documentation permise. L’examen final porte sur l’ensemble des six derniers cours. 30



Dates des examens intra
Groupe(s) Date
1 17 février 2021



Date de l'examen final
Votre examen final aura lieu pendant la période des examens finaux, veuillez consulter l'horaire à l'adresse suivante : http://etsmtl.ca/Etudiants-actuels/Baccalaureat/Examens-finaux


Politique de retard des travaux
Tout travail (devoir pratique, rapport de laboratoire, rapport de projet, etc.) remis en retard sans motif valable, c’est-à-dire autre que ceux mentionnés dans le Règlement des études (1er cycle, article 7.2.7 b / cycles supérieurs, article 6.5.4 b) se verra attribuer la note zéro, à moins que d’autres dispositions ne soient communiquées par écrit par l’enseignant dans les consignes de chaque travail à remettre ou dans le plan de cours pour l’ensemble des travaux.

Dispositions additionnelles

Une pénalité de 10 % par jour sera imposée à tous travaux en retard.




Absence à un examen
Dans les cinq (5) jours ouvrables suivants, la tenue de son examen, l’étudiant devra justifier son absence d’un examen durant le trimestre auprès de la coordonnatrice – Affaires départementales qui en référera au directeur du département ou du SEG. Pour un examen final, l’étudiant devra justifier son absence auprès du Bureau du registraire. Dans tous les cas, l’étudiant doit effectuer sa demande en complétant le formulaire prévu à cet effet qui se trouve dans son portail Mon ÉTS/Formulaires. Toute absence non justifiée par un motif majeur (maladie certifiée par un billet de médecin, décès d’un parent immédiat, Activité compétitive d’un étudiant appartenant à un club scientifique ou un club sportif d’élite de l’ÉTS ou au programme « Alliance sport étude » ou autre) à un examen entraînera l’attribution de la note zéro (0).



Plagiat et fraude
Les clauses du « Règlement sur les infractions de nature académique de l’ÉTS » s’appliquent dans ce cours ainsi que dans tous les cours du département. Les étudiants doivent consulter le Règlement sur les infractions de nature académique (https://www.etsmtl.ca/docs/ETS/Gouvernance/Secretariat-general/Cadre-reglementaire/Documents/Infractions-nature-academique ) pour identifier les actes considérés comme étant des infractions de nature académique ainsi que prendre connaissance des sanctions prévues à cet effet.  À l’ÉTS, le respect de la propriété intellectuelle est une valeur essentielle et les étudiants sont invités à consulter la page Citer, pas plagier ! (https://www.etsmtl.ca/Etudiants-actuels/Baccalaureat/Citer-pas-plagier).



Documentation obligatoire
  • Documentation disponible sur le site Moodle du cours.
  • Husson F., Lê, S. et Pagès, J. (2016). Analyse de données avec R, 2e édition, Presses Universitaires de
    Rennes. ISBN :978-2-7535-4869-5.

            ou

  • Asselin de Beauville, J.-P., Varin, S. (2014). Initiation au logiciel R : premiers pas en analyse de données. Academia-L'Harmattan. ISBN : 978-2-8061-0196-9.



Ouvrages de références

Analyse exploration des données

  • Francois Husson, Sebastien Le (Author) & Jérôme Pagès, (2017), Exploratory Multivariate Analysis by Example Using R, Chapman and Hall, 262 pages, ISBN-10: 1138196347
  • Alain Morineau, Yves-Marie Chatelin, Bernard Goldfarb & Catherine Pardoux, (2005), L'analyse statistique des données : apprendre, comprendre et réaliser avec Excel, Ellipse Édition, 407 pages, ISBN-10 : 2729823034
  • Brigittes Escofier, Jérôme Pagès, (2016), Analyses factorielles simples et multiples, Dunod, 400 pages, ISBN-10: 2100041274
  • Ludovic Lebart, Marie Piron et Alain Morineau (2006), Statistique exploratoire multidimensionnelle, Dunod, 480 pages, ISBN-10: 2100496166

Apprentissage automatique

  • Andriy Burkov, (2019), The Hundred-Page Machine Learning Book, 160 pages, ISBN-10: 199957950X
  • Tom Mitchell, (1997), Machine Learning, McGraw-Hill, 352 pages, ISBN-10: 0071154671
  • Trevor Hastie Robert Tibshirani & Jerome Friedman, (2008), The elements of statistical learning: data mining, inference and prediction, Springer, 745 pages, ISBN-10: 0387848576
  • Yaser S. Abu-Mostafa, Malik Magdon-Ismail & Hsuan-Tien Lin, (2012), Learning from data, AMLBook, ISBN-10: 1600490069
  • Ian Goodfellow, Yoshua Bengio (Author) & Aaron Courville, (2016), Deep Learning, MIT Press, 800 pages, ISBN-10: 0262035618.

Langage R

  • R core team, (2015), An Introduction to R, Samurai Media Limited, 106 pages, ISBN-10: 9881443636
  • John Taveras, (2016), R for Excel Users: An Introduction to R for Excel Analysts, CreateSpace Independent Publishing Platform, 212 pages, ISBN-10: 1500566357

Azure Machine Learning

  • Deepak Mukunthu, Parashar Shah & Wee Hyong Tok, (2019), Practical Automated Machine Learning on Azure: Using Azure Machine Learning to Quickly Build AI Solutions, O'Reilly, 198 pages, ISBN-10: 149205559X
  • Mathew Salvaris, Danielle Dean & Wee Hyong Tok, (2018), Deep Learning with Azure: Building and Deploying Artificial Intelligence Solutions on the Microsoft AI Platform, APress, 284 pages, ISBN-10: 9781484236789
  • Sumit Mund, (2015), Microsoft Azure Machine Learning, Packt Publishing, 212 pages, ISBN-10: 1784390798

D'autres références (en-ligne) sont citées sur le site Moodle du cours.




Adresse internet du site de cours et autres liens utiles

Site Moodle du cours: https://ena.etsmtl.ca/

 




Autres informations

Ne s'applique pas