Rendre la multitude de publications de recherche sur la COVID-19 accessible

Publié le 25/06/2020

EN QUOI CONSISTE LE PROJET DE RECHERCHE COLIBRI?

La pandémie COVID-19 a donné lieu à une multitude d'informations et de publications de recherche à travers le monde. Ainsi, comment trouver les informations dont nous avons besoin? C’est ici qu’intervient le projet de recherche COLIBRI, dont Mohammad Ghoniem est le Principal Investigator.

"Notre objectif est de soutenir les chercheurs afin qu'ils puissent passer au crible les collections massives de publications relatives à la COVID-19. Tout le monde essaie maintenant de contribuer à la lutte contre la pandémie", explique Mohammad.

Des chercheurs du monde entier se trouvent dans une véritable course contre la montre pour trouver des traitements, des vaccins et des méthodes de diagnostic de la COVID-19. Néanmoins, ils ne peuvent réussir que s'ils partagent et échangent régulièrement sur les derniers développements liés à la COVID-19. Un obstacle majeur réside dans la nécessité d’assimiler une abondante littérature scientifique, qui s'accroît de jour en jour. Par exemple, l’ensemble de données "CORD-19 challenge" contient environ 59 000 articles sur le coronavirus. L'Organisation Mondiale de la Santé (OMS) tient à jour et de façon manuelle une base de données de publications en pleine expansion, qui compte à ce jour environ 24 000 entrées relatives à la COVID-19. L'exploration d'une telle quantité d'informations est impossible sans un logiciel d'analyse visuelle de texte approprié, combinant la puissance des algorithmes d'exploration de texte avec la flexibilité des visualisations interactives.

Mohammad explique les différents types de publications actuellement disponibles. "C’est le cas, d’une part, pour des publications au stade préliminaire. Elles sont publiées en ligne sur différent,es bases de données même si elles doivent encore faire l’objet d’un examen minutieux et d’une analyse scientifique. Les scientifiques tentent de partager les résultats dès que possible.", détaille-t-il avant de poursuivre "Si vous êtes confrontés à, par exemple, quelques milliers de nouveaux articles que vous devez lire, personne ne peut suivre. Ces personnes ont donc besoin d'un logiciel de visualisation efficace pour les aider, et c'est précisément ce que nous faisons : nous fournissons l’outil Papyrus, que nous avons élaboré pour d’autres types d'utilisation avant la pandémie, qui s'avère être également pratique pour la COVID-19.”

L'un des objectifs de COLIBRI est de mettre gratuitement cet outil à la disposition de chercheurs du monde entier et de leur donner accès aux documents pertinents qu'il contient. Une version en libre accès de l'outil Papyrus est pré-chargée avec le dernier ensemble de données COVID-19 de l'OMS et utilisable en ligne à l'adresse colibri.list.lu. Contrairement aux moteurs de recherche ou à la recherche à facettes (de l’anglais Faceted Search), Papyrus offre une vue d'ensemble conviviale du contenu et des possibilités de recherche en profondeur au sein de sujets d'intérêt.

"Nous n'agrégeons pas les articles nous-mêmes ; certaines personnes le font déjà. Nous nous contentons donc de télécharger ces sources précédemment agrégées, comme l'OMS qui est l'une de ces sources. Cependant, les éditeurs scientifiques fournissent également des bases de données complémentaires et d'autres sources, de sorte qu'il existe de nombreuses sources. Le défi est toujours le même; le volume même des publications rend difficile l'exploitation de ces données", explique Mohammad.

En quelques clics, les utilisateurs de Papyrus sont en mesure d'affiner quelques articles - généralement 2 à 10 articles - traitant d'une question spécifique. Le projet COLIBRI a deux objectifs : améliorer la pertinence biologique des résultats en exploitant les annotations biologiques de la plateforme BioKB développée par l'équipe Bioinformatics Core du LCSB ainsi que les algorithmes d’exploitation des modèles (de l’anglais pattern mining algorithms) développés par le Centre Borelli à Paris. BioKB bénéficiera des visualisations de texte intégrées dans Papyrus et des visualisations de réseau multicouches développées conjointement par le laboratoire LaBRI à Bordeaux et le LIST pendant le projet FNR INTER BLIZAAR.

Mohammad décrit qui peut être l'utilisateur final de COLIBRI. "Ce pourrait être, par exemple, des chercheurs en biomédecine, et nous avons de telles personnes au LCSB, l'un des partenaires du projet. Nous pourrions aussi imaginer des personnes qui s'intéressent à la santé publique, donc des décideurs qui doivent, par exemple, gérer des infrastructures hospitalières ou qui doivent recommander les meilleures pratiques : comment gérer des équipes d'infirmières et de médecins pendant la pandémie COVID-19, mais aussi des aspects comme l'anxiété qui a été observée dans ces équipes en raison de leur position de première ligne et du fait qu’elles vivent plus que nous avec la pandémie".

Le projet COLIBRI est prévu pour une utilisation mondiale. "C'est pourquoi nous l'avons mis sur un site web public ; colibri.list.lu, où il y a un accès pour les invités. L’objectif est donc de faire de la publicité pour cette plateforme sur des sites web pertinents afin que nous puissions attirer des chercheurs du monde entier et peut-être obtenir leurs réactions", conclut Mohammad.

QUELLE EST LA CONTRIBUTION DU LIST DANS CE PROJET?

Le LIST possède une solide expérience en matière de visualisation, en particulier dans le domaine de l'analyse visuelle de textes et de la visualisation de réseaux. Le projet COLIBRI réutilisera et étendra deux logiciels développés au LIST : "Papyrus" pour soutenir l'exploration visuelle de grandes collections de documents, et "BLIZAAR" pour les analyses exploratoires des données de réseaux biologiques.

QUEL EST VOTRE RÔLE AU SEIN DE COLIBRI?

Je coordonne les activités de COLIBRI avec Venkata Satagopam du LCSB. En particulier, je superviserai les activités de recherche et de développement relatives à la visualisation des textes et des réseaux, et favoriserai également les synergies entre tous les partenaires du projet. 

A PROPOS DE MOHAMMAD GHONIEM:

Le Dr Mohammad Ghoniem est associé principal de recherche et de technologie au Luxembourg Institute of Science and Technology (LIST). Il a obtenu son doctorat en informatique à l'Université de Nantes (FR) en 2005. Ses principaux domaines de recherche sont la visualisation de l'information, l'analyse visuelle et l'intelligence artificielle explicable. Au cours des 20 dernières années, il a conçu, construit et évalué divers logiciels de visualisation et d'analyse de données pour divers domaines d'application, tels que la criminalistique des réseaux, la détection des fraudes dans les transactions financières et, depuis 2015, la biologie des systèmes et la microbiologie. Il a été le Principal Investigator du projet Hydviga, qui a abouti à "iCoVeR", un logiciel d'analyse visuelle permettant l'analyse exploratoire de données multivariées massives concernant la population bactérienne impliquée dans le processus de bio-méthanisation. Il a également été le coordinateur national luxembourgeois du projet ANR/FNR PRCI BLIZAAR (2016-2019) dédié à la visualisation de réseaux dynamiques multicouches, avec un cas d'utilisation en biologie des systèmes végétaux et un second en patrimoine culturel numérique.

Le Dr Mohammad Ghoniem dirige également le module de visualisation des données dans le cadre de la collaboration du LIST avec Goodyear, qui soutient la prise de décision basée sur les données dans le secteur de l'automobile.

DÉCOUVREZ LES AUTRES EXPERTS COVID-19 DU LIST:

 

Partager cette page :

Contact

Dr Mohammad GHONIEM
Dr Mohammad GHONIEM
Envoyer un e-mail