Logo ÉTS
Session
Cours
Responsable(s) Tony Wong

Se connecter
 

Sauvegarde réussie
Echec de sauvegarde
Avertissement





Cours

Section Sujets traités Heures

1

 

Analyse de données - préliminaire
  • Introduction au cours (contexte, références, matière couverte)
  • Rappel: quelques éléments d'algèbre linéaire et de statistique
    • Transformation linéaire;
    • Valeurs propres et vecteur propres;
    • Matrices semi-définie positive;
    • Variance, covariance et corrélation;
    • Matrice de covariance.
  • Éléments de base en analyse de données
    • Données centrées et réduites;
    • Nuages des individus;
    • Nuage des variables.

Ces concepts et notions seront utilisés dans toutes les autres sections de ce cours.

Les applications numériques seront effectuées avec Excel à l'aide du complément d'algèbre linéaire matrix.xla.

3

6 janvier

M. Rioux

2

Analyse en composantes principales (ACP)
  • But et contexte d'application;
  • Étude des individus;
  • Étude des variables;
  • Liens entre les deux études;
  • Individus et variables supplémentaires;
  • Applications numériques.

Techniques d'interprétation des résultats

  • Projection des individus dans l'espace des variables;
  • Projection des variables dans l'espace des individus;
  • Qualité de représentation Cos2;
  • Contribution des individus - des variables;
  • Cercle de corrélation.

Les applications numériques seront effectuées avec Stagraphics et R.

3

13 janvier

M. Rioux

3

Analyse factorielle des correspondances (AFC)
  • But et contexte d'application;
  • Test de l'indépendance du khi carré;
  • Étude des profils-lignes;
  • Étude des profils-colonnes
  • Liens entre les deux études;
  • Effet Guttman;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Les applications numériques seront effectuées avec Stagraphics et R.

3

20 janvier

M.Rioux

4 Analyse (factorielle) des correspondances multiples (ACM)
  • But et contexte d'application;
  • Tableau disjonctif complet des données;
  • AFC sur le tableau disjonctif complet;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Les applications numériques seront effectuées avec Stagraphics et R.

3

27 janvier

M. Rioux

5 Classification hiérarchique et partitionnement
  • But et contexte d'application;
  • Notions de ressemblance;
  • Utilité du partitionnement et de la classification hiérarchique en analyse factorielle;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Détermination du nombre de classes.

Les applications numériques seront effectuées avec Stagraphics et R.

3

3 février

M. Rioux

6

Modèles classiques de régression

  • But et contexte d'application;
  • Régression multiple;
  • Régression logistique;
  • Analyse discriminante;
  • Exemples numériques.

Les applications numériques seront effectuées avec Stagraphics et R.

3

10 février

M. Rioux

7 INTRA

3

17 février

M. Rioux

7

Modèles prédictifs - préliminaire
  • Apprentissage et validation;
  • Données pour l'apprentissage et validation;
  • Caractéristiques et cibles;
  • Généralisation, précision et justesse;

Microsoft Azure ML

  • Compte Azure et son portail;
  • Création d'un espace de travail;
  • Azure ML Studio (classic);
  • Exemple d'utilisation
    • Jeu de données;
    • Modules;
    • Paramètres des modules;
    • Expériences;
    • Modèles prédictifs;
    • Apprentissage et évaluation.

La conception et l'application des modèles prédictifs se feront à l'aide d'Azure Machine Learning (classic) un environnement infonuagique de Microsoft.

3

03 mars

T. Wong

8

Modèles prédictifs et mesures de performance

Modèles

  • Arbres et forêt d'arbres décisionnels;
  • Naïve Bayes;
  • K-means;
  • Machines à vecteurs de support.
  • Réseaux de neurones;
  • Apprentissage profond.

Mesures

  • Justesse;
  • Perte logistique;
  • AUC ROC;
  • Matrice de confusion
  • MAE, MSE.

6

10 - 17 mars

T. Wong

9

Étapes de conception
  • Préparation du jeu de données;
  • Apprentissage du modèle prédictif:
    • Hold out;
    • Validation croisée.
  • Évaluation du modèle prédictif;
  • Test du modèle prédictif;
  • Déploiement du modèle prédictif sous forme d'un service WEB;
  • Test du service WEB.

Les étapes de conception seront présentés à l'aide d'Azure Machine Learning (classic) un environnement infonuagique de Microsoft.

6

24 - 31 mars

T. Wong

10

Conception de solutions
  • Prédire le désabonnement des clients;
  • Segmentation de la clientère;
  • Détection d'anomalie;
  • Intégration avec Power BI.

3

07 avril

T. Wong

  Total 39
 

Laboratoires et travaux pratiques

Durant les séances de laboratoire, les étudians doivent oeuvrer, au sein d’une équipe, dans des scénarios de conception, realisation et implantation intégrant les technologies en analyse de données et en apprentissage automatique. Ils doivent appliquer et comparer la performance des modèles prédictifs conçus pour répondre aux besoins des organisations et entreprises.


Utilisation d'outils d'ingénierie

  • Microsoft Excel;
    • matrix.xla;
  • Statgraphics;
  • R et RStudio;
    • FactoMineR, Factoshiny, factoextra et FactoInvestigate;
  • Microsoft Machine Learning Studio;
  • Microsoft Power BI.