Profil de recherche – Choisir l’algorithme adapté à la mission


Dr David Buckeridge

Un chercheur de l'Université McGill évalue des algorithmes statistiques pouvant analyser des masses de données médicales et détecter l'éclosion de maladies.

Retour à l'article principal ]

Comment savoir si une maladie infectieuse est en voie de se répandre dans la population?

La surveillance des maladies est de tout temps un travail très laborieux qui repose sur la transmission des résultats de tests de laboratoire aux responsables de la santé publique, lesquels se chargent d’entrer manuellement l’information dans une base de données.

Mais les dossiers médicaux électroniques et les médias sociaux ont créé de nouvelles possibilités d’étendre et d’automatiser la surveillance de la santé publique. La consultation des rapports de médecin, des dossiers de pharmacie, des appels aux services d’urgence, et même des messages Twitter et du Web comptent parmi les nouvelles approches employées pour détecter l’éclosion de maladies et intervenir en conséquence. Mais comment les responsables font-ils pour trier toute cette information?

En bref

Qui – Dr David Buckeridge, Université McGill.

Question – La surveillance automatisée des maladies gagne en popularité, mais il existe peu d'études visant à aider les responsables de la santé publique à choisir le meilleur algorithme pour analyser différents types de données.

Approche – Le Dr Buckeridge et ses collègues utilisent un modèle de simulation informatique à grande échelle du réseau de distribution d’eau de Montréal pour vérifier l’efficacité de différents algorithmes dans la détection de maladies d’origine hydrique.

Impact – Le Dr Buckeridge espère créer un guide qui aidera les responsables de la santé publique à choisir l’algorithme adapté à la mission.

« Une fois ces données en main, il faut y déceler les changements inattendus, laissant supposer que quelque chose se prépare », précise le Dr David Buckeridge, de l’Université McGill.

Les chercheurs et les responsables de la santé publique dépendent généralement d’algorithmes statistiques pour la « lecture » de ces données.

En informatique, un algorithme constitue une série de commandes détaillées qu’un ordinateur doit exécuter pour accomplir une tâche. Les algorithmes statistiques permettent de passer au crible de grands ensembles de données afin d’y repérer des tendances inhabituelles ou des changements. Ils peuvent servir, par exemple, à détecter une hausse soudaine du nombre d’hospitalisations ou d’ordonnances de certains médicaments.

Lorsqu’ils recherchent des signes d’éclosion d’une maladie, les responsables de la santé publique peuvent avoir le choix entre plusieurs algorithmes, dont la sensibilité, la spécificité et la rapidité peuvent varier.

« Il existe vraiment peu d’information fiable pour guider les praticiens de la surveillance en santé publique dans le choix du meilleur algorithme à utiliser pour déceler des changements dans les données », ajoute le Dr Buckeridge.

Grâce au financement des Instituts de recherche en santé du Canada, le Dr Buckeridge et son équipe évaluent l’efficacité de différents algorithmes pour la surveillance de la santé publique. Un de leurs projets est une collaboration avec des chercheurs de l’École polytechnique de Montréal, qui ont conçu un modèle de simulation informatique très détaillé du réseau de distribution d’eau de la ville de Montréal. Le modèle permet aux chercheurs de simuler des pannes dans le système de traitement de l’eau et de déterminer les secteurs de la ville qui seraient touchés par la contamination de l’eau.

S’appuyant sur les résultats du modèle de distribution d’eau, le Dr Buckeridge et son équipe ont créé un deuxième modèle pour simuler des infections et des symptômes dans la population et l’utilisation des services de santé qui en résulterait. Ce modèle permettra aux chercheurs de générer des données de santé publique pour différents scénarios de contamination (p. ex. nombre de malades, moment où ils commenceront à se présenter aux urgences). En collaboration avec des collègues informaticiens de l’Université McGill, ils se servent de nombreux ensembles de données de simulation pour vérifier l’efficacité de différents algorithmes dans la détection des signes d’éclosion de maladies d’origine hydrique.

« Étant donné que les données sont fictives, nous savons exactement où les éclosions ont lieu et où elles n’ont pas lieu, ce qui nous permet de comparer l’efficacité des algorithmes », explique-t-il.

Le Dr Buckeridge espère créer des lignes directrices qui aideront les analystes de la santé publique à choisir l’algorithme adapté à leur ensemble de données, ou encore à concevoir des systèmes de surveillance automatisée capables d’alterner entre différents algorithmes selon le type de données à analyser.

Tandis qu’il achève cette étude, le Dr Buckeridge souhaite aller plus loin et commence à explorer des algorithmes statistiques applicables à la gestion des éclosions de maladies.

« Pour faire l’analogie avec le clinicien examinant son patient, souvent, le problème ne réside pas dans le diagnostic, mais dans la gestion de la maladie, déclare le Dr Buckeridge. Ici, le diagnostic correspond à la détection d’une épidémie, mais le plus grand problème consiste à déterminer les moyens à prendre pour lutter contre l’épidémie et limiter les cas de maladie et de décès et les pertes économiques. »

« Une fois ces données en main, il faut y déceler les changements inattendus, laissant supposer que quelque chose se prépare. »
– Dr David Buckeridge, Université McGill

Supplemental content (right column)