Recherche

Mes recherches portent sur l'intersection des statistiques bayésiennes, de l'analyse de données à grande échelle, de la génomique, de la bioinformatique et de la biostatistique. Je développe et applique des méthodes statistiques et informatiques pour les données complexes de grande dimension, en particulier celles qui se posent en génomique, en séquençage de nouvelle génération, en analyse de données moléculaires et en recherche en santé publique.

Un thème central de mes travaux est l'inférence bayésienne et bayésienne empirique pour les études à grande échelle, où des milliers, voire des millions de caractéristiques (gènes, SNP, protéines, souches microbiennes ou variants génomiques, par exemple) sont analysées simultanément afin d'identifier des associations, des signaux ou la structure biologique sous-jacente. Dans ce contexte, je m'intéresse particulièrement aux probabilités a posteriori, aux taux de faux positifs locaux, à la quantification de l'incertitude et aux méthodes robustes d'extraction de données fiables à partir de données bruitées, hétérogènes et de grande dimension.

Une grande partie de mes travaux appliqués a porté sur la génomique et la bioinformatique, notamment les données de séquençage de nouvelle génération, l'identification de variants, l'analyse de l'expression génique, la décomposition des types cellulaires et l'estimation des mélanges de souches microbiennes. Ces problèmes sont scientifiquement importants et statistiquement complexes car ils impliquent souvent des structures de dépendance complexes, des erreurs de mesure, de faibles rapports signal/bruit et la nécessité d'outils informatiques reproductibles et évolutifs.

Je m'intéresse également à la transposition de méthodes statistiques avancées en logiciels pratiques, accessibles et libres. Mes travaux portent notamment sur le développement de logiciels statistiques et de chaînes de traitement analytiques pour l'estimation du taux de faux positifs local, l'identification de variants, l'estimation de la composition cellulaire et l'identification de mélanges de souches. Plus largement, mon objectif est de concevoir des méthodes non seulement rigoureuses sur le plan théorique, mais aussi utiles aux scientifiques, analystes et décideurs travaillant avec des données biologiques et de santé publique réelles.

Récemment, mes recherches se sont étendues aux approches bayésiennes pour l'évaluation de l'exposition nutritionnelle et l'estimation des apports habituels, avec des applications en matière de surveillance de la santé publique et d'évaluation des risques. Ce travail relie mon intérêt plus général pour la méthodologie bayésienne au contexte de la recherche appliquée de Santé Canada, où les méthodes statistiques peuvent appuyer la prise de décisions fondée sur des données probantes et l'analyse pertinente pour les politiques.