Ce module fournit une douce introduction aux concepts-clés en statistique. Les méthodes statistiques sont utilisées dans divers domaines, de la recherche scientifique à la prise de décision commerciale.
Vous apprendrez comment quels sont les types de données, comment ils conditionnent le choix des méthodes statistiques. De plus, vous découvrirez des outils de visualisation de données, des outils pour la détection des données extrêmes et vous saurez démystifier les tests statistiques et la prise de décision en présence d’incertitude.
Cette formation fournit une solide base pour les autres modules de formation.
Plan de cours
Session 1: Introduction à la statistique
- Séparer le signal du bruit
- Population(s), échantillons(s), variabilité échantillonnale, représentativité
- Statistique descriptive vs. inférentielle
- Type et rôle des variables
- Caractérisation de distributions
Session 2: Statistique descriptive ou analyse exploratoire de données
- Statistique descriptives – Ce qu’elles sont et quand les utiliser
- Comment résumer et visualiser au mieux les données
- Détection et gestion de données extrêmes « outliers »
- Statistiques bivariées
- Pièges et bonnes pratiques
Session 3: Principe des tests d’hypothèses
- Contrôler le risque de prendre de mauvaises décisions
- Hypothèses nulle et alternatives, p-values, puissance, niveau de confiance, « effect size », tests uni- vs. bi-latéraux
- Signification statistique vs. signifiance pratique
- Intervalles de confiance: Interprétation et utilité
Session 4: Estimation de la taille d’échantillon
- Principe du calcul de la taille d’échantillon
- Notion de puissance
- Paramètres intrants requis: Effect size, variabilité ou bruit, niveaux de risque tolérables
- Application numérique au cas d’un seul échantillon
- Résumé
Durée de la formation
La durée recommandée de cette formation est de 4 sessions en ligne.
Public cible
Cette formation s’adresse à tout le personnel scientifique qui recueille des données et qui prend des décisions basées sur ces données. Elle présente les idées et concepts importants en statistique et en analyse de données. Les participants n’ont pas besoin d’avoir de connaissances en statistique ou alors s’ils en possèdent, ils peuvent ne pas les avoir utilisées depuis longtemps.