L’analyse de classification (clustering, unsupervised learning) comprend une collection de techniques visant à regrouper des objects possédant des caractéristiques similaires: consommateurs, pays, espèces, gènes, etc. C’est un champ de recherche très actif en statistique. Dans cette formation vous découvrirez les outils classiques ainsi que les récents développements.
L’utilisation de l’analyse de classification est abordée à l’aide d’études de cas réels.
Plan de la formation
Session 1: Principe et méthodes classiques
- Introduction à l’analyse de classification
- Contexte d’utilisation, objectif et terminologie
- Principe des méthodes hiérarchiques
- Techniques de modélisation
Session 2: Médhodes modernes et applications
- Méthodes d’optimisation
- Autres méthodes: Classification floue
- La gestion des variables de classification continues
- Outils pour identifier le nombre optimal de clusters
Session 3: Que faire avec les clusters?
- Utilisation et interprétation des clusters
- Apprentissage automatique
- Utilisation de logiciels statistiques
- Résumé
Durée de la formation
La durée recommandée de cette formation est de 3 sessions en ligne.
Public cible
Cette formation couvre les aspects pratiques des méthodes de classification les plus utilisées en pratique. Elle s’adresse aux non-statisticiens utilisant des méthodes statistiques –chercheurs, analystes, techniciens de laboratoire, assistants de recherche, ingénieurs, étudiants gradués, etc. – ainsi qu’aux statisticiens intéressés par un atelier appliqué.
Ce module présente les idées importantes en statistique et en analyse de données, notamment en analyse de classification. Les participants n’ont pas besoin d’avoir de connaissances en statistique ou alors s’ils en possèdent, ils peuvent ne pas les avoir utilisées depuis longtemps.