Contenu détaillé[1]
1. Introduction (3 heures[2])
1.1 Définition du forage : approches descriptives, prédictives et d’agrégation
1.2 Apprentissage machine et forage de données
1.3 Utilisation du forage : analyse des données, prétraitements, choix des approches, évaluation des résultats
1.4 Processus standard intersectoriel pour l'exploration de données
2. Rappel des techniques supervisées (3 heures)
2.1 Classification et prédiction
2.2 Arbres de décision
2.3 Classifieur bayésien
2.4 Plus proches voisins
2.5 Réseaux de neurones
3. Techniques non supervisées: forage de règles (10 heures)
3.1 Patrons fréquents et ensemble d'items fréquents
3.2 Règles d'association (confiance, support et lift)
3.3 Algorithme Apriori
3.4 Évaluation des patrons (Lift, khi 2, mesures nulles invariantes, comparaison des mesures)
4. Techniques non supervisées: groupements (10 heures)
4.1 Critères de groupement, distances inter et intra groupes
4.2 Familles d'algorithmes (modèle, densité, patition, grille, hiérarchique)
4.3 Validation et évaluation (qualité, stabilité, tendance)
4.4 Techniques par partitionnement, hiérarchiques, par densité, par grilles
5. Données textuelles et audio-visuelles et extraction d’information (7 heures)
5.1 Défis et besoins industriels d'analyse des données
5.2 Préparation des données: types de données, sources, styles, qualité, format
5.3 Choix des caractéristiques pour l'apprentissage machine et problèmes de dimensionnalité
5.4 Réduction des dimensions (analyse factorielle, composantes principales) et analyses de topiques
6. Sujets variés (6 heures)
6.1 Éthique et impacts sociaux
6.2 Forage de séries temporelles (propriétés, décomposition, prédiction, ARIMA)
6.3 Forage de séquences et de graphes
[1] La matière ne sera pas nécessairement présentée dans cet ordre; le contenu de certaines sections couvrant les cours 6 à 13 pourra être modifié afin de mieux s'aligner sur les projets des étudiants du groupe.
[2] Ces heures sont des heures approximatives d’enseignement pour chaque sujet et incluent le temps alloué à l’examen.