Logo ÉTS
Session
Cours
Responsable(s) Sylvie Ratté

Se connecter
 






Cours

Contenu détaillé[1]

1.    Introduction (3 heures[2])

  1.1    Définition du forage : approches descriptives, prédictives et d’agrégation

  • 1.2    Utilisation du forage : analyse des données, prétraitements, choix des approches, évaluation des résultats

 

2.    Techniques de forage (10 heures)

2.1    Patrons, associations et corrélations (ensemble d’items fréquents, règles d’association, etc.)

2.2    Classification et prédiction (arbre de décision, classifieur bayésien, etc.)

2.3    Analyse par agrégation (types de données, distances, méthode par partition, par hiérarchies, par densité, etc.)

2.4    Évaluation des résultats des classifieurs et des agrégateurs.

3.    Forage de textes et extraction d’information (10 heures)

3.1    Analyse des données textuelles et extraction d’information

3.2    Dimensionnalité,  indexation sémantique latente, allocation latente de Dirichle

3.3    Classification et agrégation automatique de documents

3.4    Analyse des langues naturelles

4.    Forage du Web (6 heures)

4.1    Forage de la structure

4.2    Forage des données multimédias (audio, image, vidéo)

4.3    Classification automatique de documents Web

4.4    Forage des flux de données

5.    Sélection des attributs (7 heures)

5.1    Identification et utilisation des données atypiques (« outliers »)

5.2    Analyse factorielle des correspondances – AFC

5.3    Analyse des composantes principales – ACC

5.4    Techniques de régression

6.    Compléments et techniques particulières (3 heures)

6.1    Méthodes avancées d’agrégation (« clustering »)

6.2    Forage de données spécialisées : télécommunication, biologie, intrusion, etc.)

6.3    Utilisation à des fins de sécurité et de renforcement de la loi

6.4    Impacts sociaux du forage de données

 


[1]  La matière ne sera pas nécessairement présentée dans cet ordre; le contenu de certaines sections couvrant les cours 6 à 13 pourra être modifié afin de mieux s'aligner sur les projets des étudiants du groupe. 

[2]   Ces heures sont des heures approximatives d’enseignement pour chaque sujet et incluent le temps alloué à l’examen.