Logo ÉTS
Session
Cours
Responsable(s) Michel Rioux, Tony Wong

Se connecter
 

Sauvegarde réussie
Echec de sauvegarde
Avertissement





Cours

 

1ère partie : Analyse de données multidimensionnelles (Michel Rioux)

Date

Analyse de données - préliminaire
  • Introduction au cours (contexte, références, matière couverte)
  • Rappel : quelques éléments d'algèbre linéaire et de statistique
    • Transformation linéaire;
    • Valeurs propres et vecteur propres;
    • Variance, covariance et corrélation;
    • Matrice de covariance.
  • Éléments de base en analyse de données
  • Données centrées et réduites;
  • Nuages des individus;
  • Nuage des variables.


Ces concepts et notions seront utilisés dans toutes les autres sections de ce cours.
Les applications numériques seront effectuées avec Excel et à l'aide du complément d'algèbre linéaire matrix.xla.

Analyse en composantes principales (ACP)

  • But et contexte d'application;
  • Étude des individus;
  • Étude des variables;
  • Liens entre les deux études;
  • Individus et variables supplémentaires;
  • Applications numériques.

Techniques d'interprétation des résultats

  • Projection des individus dans l'espace des variables;
  • Projection des variables dans l'espace des individus;
  • Qualité de représentation Cos2;
  • Contribution des individus - des variables;
  • Cercle de corrélation.

Les applications numériques seront effectuées avec Stagraphics et R/FactomineR.

10 mai 2022

Analyse factorielle des correspondances (AFC)
  • But et contexte d'application;
  • Test de l'indépendance du khi carré;
  • Étude des profils-lignes;
  • Étude des profils-colonnes
  • Liens entre les deux études;
  • Effet Guttman;
  • Exemples numériques.
Techniques d'interprétation des résultats
  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Analyse (factorielle) des correspondances Multiples (ACM)

  • But et contexte d'application;
  • Tableau disjonctif complet des données;
  • AFC sur le tableau disjonctif complet;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Les applications numériques seront effectuées avec Stagraphics et R/FactomineR.

17 mai 2022

Classification hiérarchique et partitionnement

  • But et contexte d'application;
  • Notions de ressemblance;
  • Utilité du partitionnement et de la classification hiérarchique en analyse factorielle;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Détermination du nombre de classes.

Modèles classiques de régression

  • But et contexte d'application;
  • Régression multiple;
  • Régression logistique;
  • Analyse discriminante;
  • Exemples numériques.

Les applications numériques seront effectuées avec Stagraphics et R/FactomineR.

24 mai 2022

 

2e partie : Conception et déploiement des systèmes prédictifs (Tony Wong)

Date

Traitement des données

  • Nettoyage;
  • Mise en échelle;
  • Détection des valeurs aberrantes;
  • Jeu de données déséquilibré.

Ingénierie et sélection des caractéristiques

  • Regroupement des données (binning)
    • Entropie et MDL (Minimum Description Length);
    • Quantiles;
    • Largeur égale;
    • Largeur personnalisée;
    • ACP.
  • Sélection des caractéristiques
    • Approche « filter » : corrélation, théorie de l’information, tests statistiques;
    • Approche « wrapper » : importance des caractéristiques basée la permutation (permutation feature importance).

Les applications pratiques seront effectuées avec Azure ML studio Desginer.

31 mai 2022

Intégration avec R

  • Survol de R;
  • Déploiement de R;
  • Exemples d’application.

Modèles prédictifs

  • Boosted Decision Trees;
  • SVM (Support Vector Machines);
  • Bayes Point Machines;
  • Neural Networks;
  • K-means;
  • Self-organizing Maps
  • Interprétation des résultats par LIME et SHAP

Les applications pratiques seront effectuées avec Azure ML studio Designer et R.

7 juin 2022

Systèmes prédictifs en tant que services WEB

  • Conversion des modèles prédictifs en services WEB;
  • Utilisation des modèles prédictifs à distance :
    • Query editor de Power BI;
    • VBA d'Excel;

Déploiement en entreprise

  • Intégration dans Power Automate
    • Création d’un « flow »;
    • Personnalisé le « flow »;
    • Automatisation par des éléments UI (User Interface);
    • Réaliser des requêtes.
  • Intégration dans Power Apps
    • Création d’une application mobile/web;
    • Connexion aux services WEB des modèles prédictifs;
    • Réaliser des requêtes.

Les applications pratiques seront effectuées avec Azure ML studio Designer, Excel, R, Power Automate et Power Apps.

14 juin 2022

 

 

Laboratoires et travaux pratiques

(Pas de séances de TP).