Logo ÉTS
Session
Cours
Responsable(s) Tony Wong

Se connecter
 

Sauvegarde réussie
Echec de sauvegarde
Avertissement





Cours

Section Sujets traités Heures

1

 

Analyse de données - préliminaire
  • Introduction au cours (contexte, références, matière couverte)
  • Rappel: quelques éléments d'algèbre linéaire et de statistique
    • Transformation linéaire;
    • Valeurs propres et vecteur propres;
    • Matrices semi-définie positive;
    • Variance, covariance et corrélation;
    • Matrice de covariance.
  • Éléments de base en analyse de données
    • Données centrées et réduites;
    • Nuages des individus;
    • Nuage des variables.

Ces concepts et notions seront utilisés dans toutes les autres sections de ce cours.

Les applications numériques seront effectuées avec Excel à l'aide du complément d'algèbre linéaire matrix.xla.

3

04 janvier

2

Analyse en composantes principales (ACP)
  • But et contexte d'application;
  • Démarche intuitive;
  • Détails techniques;
  • Jargons:
    • Factors, factor loading, components loadings, factor scores, etc.
  • Étapes de calculs;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Projection des individus dans l'espace des variables;
  • Statistique T2 de Hotelling;
  • Qualité de représentation Cos2;
  • Contribution des individus - des variables;
  • Cercle de corrélation.

Les applications numériques sur Excel et sur Google Colab en R.

6

11 javier

et

18 janvier

3

Analyse factorielle des correspondances (AFC)
  • But et contexte d'application;
  • Démarche intuitive;
  • Détails techniques
    • Décomposition orthogonale par SVD;
    • Coordonnées des facteurs:
      • standards;
      • principales.
  • Étapes de calcul;
  • Exemples numériques.

Techniques d'interprétation des résultats

  • Géométrie des coordonnées principales;
  • Distance par rapport à l'origine;
  • Inertie d'un point, d'une composante;
  • Contribution d'un point;
  • Qualité de représentation Cos2.

Les applications numériques seront effectuées sur Google Colab en R.

6

25 janvier

et

01 février

4

Modèles classiques de régression

  • But et contexte d'application;
  • Démarche intuitive;
  • Régression
    • multiple;
    • logistique;
  • Analyse discriminante;
  • Exemples numériques.

Les applications numériques seront effectuées avec Stagraphics et R.

3

08 février

5 INTRA

3

15 février

6

Conception de modèles prédictifs - survol du processus
  • Apprentissage et validation;
  • Données pour l'apprentissage et validation;
  • Caractéristiques et cibles;
  • Généralisation, précision et justesse;

Microsoft Azure ML

  • Compte Azure et son portail;
  • Création d'un espace de travail;
  • Azure ML Studio;
  • Exemple d'utilisation
    • Jeu de données;
    • Modules;
    • Paramètres des modules;
    • Expériences;
    • Modèles prédictifs;
    • Apprentissage et évaluation.

La conception et l'application des modèles prédictifs se feront à l'aide d'Azure Machine Learning Studio un environnement infonuagique de Microsoft.

3

22 février

7

Conception de modèles prédictifs et mesures de performance

Modèles

  • Arbres et forêt d'arbres décisionnels;
  • Naïve Bayes;
  • K-means;
  • Machines à vecteurs de support.
  • Réseaux de neurones;
  • Apprentissage profond.

Mesures

  • Justesse;
  • Perte logistique;
  • AUC ROC;
  • Matrice de confusion
  • MAE, MSE.

3

29 février

8

Étapes de conception
  • Préparation du jeu de données;
  • Apprentissage du modèle prédictif:
    • Hold out;
    • Validation croisée.
  • Évaluation du modèle prédictif;
  • Test du modèle prédictif;
  • Déploiement du modèle prédictif sous forme d'un service WEB;
  • Test du service WEB.

Les étapes de conception seront présentés à l'aide d'Azure Machine Learning un environnement infonuagique de Microsoft.

6

14 mars

et

21 mars

9

Intégration avec Power Platform
  • Survol de Power Plaform
  • Utilisation des modèles prédictifs déployés dans:
    • Power BI;
    • Power Automate.

Les étapes d'intégration seront présentées à l'aide de Power BI et de Power Automate de Microsoft.

6

28 mars

et

11 avril

  Total 39
 

Laboratoires et travaux pratiques

Durant les séances de laboratoire, les étudians doivent oeuvrer, au sein d’une équipe, dans des scénarios de conception, realisation et implantation intégrant les technologies en analyse de données et en apprentissage automatique. Ils doivent appliquer et comparer la performance des modèles prédictifs conçus pour répondre aux besoins des organisations et entreprises. Ils sont aussi intégrer les modèles prédictifs déployés dans des outils d'automatisation des processus d'affaire.


Utilisation d'outils d'ingénierie

  • Microsoft Excel;
    • matrix.xla;
  • Google Colab en R:
    • FactoMineR et factoextra;
  • Microsoft Machine Learning Studio;
  • Microsoft Power BI;
  • Microsoft Power Automate.