Analyse statistique des données métagénomiques

Les données métagénomiques présentent des spécificités qui nécessitent des méthodes statistiques adaptées. Découvrez les outils statistiques les plus couramment utilisés dans ce domaine. L’atelier passe d’abord en revue le mécanisme des tests d’hypothèses statistiques. Ensuite, l’accent est mis sur la compréhension de la structure des données et des problèmes spécifiques aux données « omiques ». L’ANOVA classique et ses alternatives en génomique sont ensuite abordées. Enfin, les méthodes avancées et les outils de visualisation des données sont abordés.

Plan de la formation

Session 1: Test d’hypothèses statistiques

  • Prise en compte de la variabilité échantillonnale dans le processus de prise de décision
  • Mécanisme sous-jacent aux tests d’hypothèses
    • Hypothèses nulle et alternative
    • Tests unilatéraux et bilatéraux
    • Statistique de test
    • Règle de décision: valeur critique et p-value
    • Signification statistique vs. signification pratique, taille de l’effet à détecter
  • Risques liés aux tests d’hypothèses : niveau de confiance et puissance
  • Contrôler les risques
  • Idée générale sous-jacente à la détermination de la taille de l’échantillon et de la puissance

Session 2: Comprendre la structure des données, l’analyse exploratoire des données et les problèmes spécifiques aux données métagénomiques

  • Spécificités des données métagénomiques
  • Problèmes spécifiques
  • Différences avec les données classiques
  • Résumer efficacement les données
  • Multiplicité dans les tests statistiques
    • Qu’est-ce que la multiplicité?
    • Identifier les situations conduisant à la multiplicité
    • Gérer la multiplicité – Méthodes d’ajustement: Bonferroni, Tukey, Benjamini-Hochberg, etc.

Session 3: ANOVA classique et ses alternatives en génomique

  • Rappel des principes de base de l’ANOVA
  • Interprétation du tableau d’ANOVA
    • Importance des facteurs et des interactions
    • Interprétation des facteurs et des interactions
  • Principe sous-jacent à la MANOVA
  • Spécificités des données métagénomiques et méthodes alternatives
  • Principe de l’ANOSIM et de la PERMANOVA
    • Comparaison des centroïdes
    • Hétérogénéité de la dispersion entre les groupes
    • Comparaisons multiples
    • Visualisation des résultats

Session 4: Méthodes avancées et visualisation des données

    • Différentes mesures de distance en métagénomique
      • Principe et sélection d’une métrique appropriée
    • Analyse en composantes principales (ACP)
    • Analyse des correspondences (AC)
    • MultiDimensional Scaling (MDS)
    • Analyse des coordonnées principales (PCoA)

Durée de la formation

La durée recommandée de cette formation est de 4 sessions en ligne.

Public cible

Cette formation s’adresse aux ingénieurs, chercheurs, bioinformaticiens, biologistes et en fonction du public visé, le cours est adapté. D’une part en utilisant des exemples spécifiques au domaine d’application et d’autre part en présentant des outils ou applications spécifiques, le cas échéant.