Tracer l'évolution de la COVID-19 avec des graphiques complets

Publié le 30/06/2020

EN QUOI CONSISTE LE PROJET DE RECHERCHE HKG4COVID?

La création de graphiques est un moyen essentiel pour appréhender les connaissances et obtenir un instantané de l'évolution du sujet concerné. Il s’agit par ailleurs de l’objectif du LIST à travers le projet «Historical Knowledge Graph for COVID-19 project», aussi nommé HKG4COVID.

Cédric Pruski, Principal Investigator du projet, explique: «Le projet porte sur l'évolution que nous avons décrite sur le Coronavirus dans la littérature scientifique. Nous avons donc beaucoup d'articles qui contiennent des connaissances que nous extrayons des textes pour construire des graphiques».

Les graphiques de connaissances (de l’anglais Knowledge Graphs, KG) - ou plus généralement base de connaissances - fournissent les éléments de base pour représenter les connaissances d'un certain domaine de façon interprétable pour une machine. Cela permet aux ordinateurs d’utiliser ces connaissances à des fins diverses, comme par exemple pour la recherche d'informations, la découverte de connaissances et l'aide à la décision.

«C'est donc ce que font actuellement plusieurs groupes de recherche dans le monde. Il y a beaucoup d'approches qui exploitent les informations contenues dans la littérature - en extraient quelques relations et concepts - et construisent un graphique à partir de ces informations. A travers le projet HKG4COVID, nous allons ajouter la dimension temporelle à ces graphes.», explique Cédric.

Il existe d'innombrables projets de recherche COVID-19 qui produisent des graphiques, cependant ils tendent à amalgamer l'état le plus récent des connaissances. Cela signifie que l'histoire de la maladie - c'est-à-dire la façon dont nos connaissances sur la maladie ont évolué - est rarement préservée et des informations cruciales sur la COVID-19 sont donc perdues. En conséquence, les connaissances passées qui sont décrites avec une terminologie ou des concept dépassés peuvent être extrêmement difficiles à retrouver. C’est par ailleurs le cas de la littérature scientifique indexée avec une ontologie dépassée. Le projet HKG4COVID permettra de construire des graphiques de connaissances historiques sur la COVID-19 à partir de graphiques de connaissances existantes et de millions d'articles scientifiques.

«Les graphiques que nous construisons peuvent être gigantesques ! Il y a des milliards d'entités, y compris des termes conceptuels, des synonymes, des relations entre les termes, etc., car nous avons des millions d'articles scientifiques qui sont publiés ces dernières années.», déclare Cédric.

En parlant des utilisateurs finaux potentiels de HKG4COVID, Cédric explique que «cela dépend de la portée du projet, mais fondamentalement, il s'agit des chercheurs et des communautés de recherche».

Le projet HKG4COVID n’est pas très éloigné d'un autre projet du LIST, COLIBRI, qui traite des données. Cédric souligne le lien : «Nous sommes juste une étape avant COLIBRI, qui se focalise sur la visualisation des données. Nous construisons donc le graphique et ensuite nous pouvons l’injecter dans COLIBRI. Enfin, nous obtenons les deux :  la création, construction de ce graphique historique, et la visualisation».

Mais le LIST n'est pas seul dans le projet et travaille en collaboration avec le LCSB de l'Université du Luxembourg. «Nous sommes partenaires du LCSB. En effet, ils disposent déjà de ce type de base de connaissances représentant les termes conceptuels de la littérature qu'ils proposent, et qui est également accessible au public. Nous partons donc de leur base de connaissances et nous enrichissons notre graphique s’intéressant à l'évolution de la COVID-19».

HKG4COVID n'est bien entendu pas le seul projet à rechercher ce type d'informations sur la COVID-19. «Il existe de nombreux projets de base de connaissances sur le coronavirus dans le monde entier. L'idée serait donc également de relier ces graphiques à des relations sémantiques spécifiques et des relations évolutives pour rendre ces connaissances encore plus importantes.», ajoute Cédric.

«Le projet se concentre principalement sur la partie médicale, mais il y a plusieurs autres dimensions. Nous avons l'impact socio-économique, les effets environnementaux - car nous ne savons pas encore si le climat a une influence sur la maladie - et ainsi de suite. Ainsi, si nous parvenons à relier tous les différents ensembles de données qui existent dans le monde entier avec un aspect spécifique de la maladie, ce serait également une très grande contribution,» conclut Cédric.

QUELLE EST LA CONTRIBUTION DU LIST DANS CE PROJET?

«L'idée du projet et de la contribution du LIST est d'ajouter la dimension temporelle de la maladie aux graphiques. Actuellement, tous les graphiques qui existent ne font que représenter la situation actuelle des connaissances. Nous n'avons pas la compréhension globale et la compréhension de l'évolution temporelle de ces connaissances dans le temps. Nous allons donc l’ajouter.

La contribution de la recherche pour le projet HKG4COVID provient à 100% du LIST. Le LCSB nous fournit les données qu'il a collectées. Le LCSB fournit également un soutien pour la validation du fait de ses connaissances médicales. Nous leur montrons ce que nous avons extrait et ils nous diront si nos conclusions ont du sens d'un point de vue médical. Nous pourrons alors les ajouter à l'ensemble des données».

QUEL EST VOTRE RÔLE AU SEIN DE HKG4COVID?

«Je suis le Principal Investigator du projet. Mon rôle principal est de veiller à ce que le projet soit bien géré. Je dois également m'assurer que la collaboration avec le LCSB se déroule bien. C’est en effet la clef pour des projets futurs. Je participe aussi à des tâches de recherche : je propose des idées, je les valide, etc. De la recherche fondamentale, dirais-je».

A PROPOS DE CÉDRIC PRUSKI:

Cédric Priski est Senior Researcher au LIST. Ses intérêts portent sur l'intelligence artificielle ainsi que la représentation et le raisonnement des connaissances. Il est titulaire d’une "Habilitation à Diriger des Recherches" de l'Université Paris-Saclay (FR) et d’un doctorat en informatique de l'Université Paris-Sud (FR) et de l'Université du Luxembourg. Il est le co-auteur de plus de 70 articles scientifiques et a co-encadré quatre doctorants.  Cédric Pruski a coordonné avec succès des projets de recherche nationaux et internationaux générant 4 soutenances de doctorat, de nombreuses publications dans des conférences majeures et des revues scientifiques spécialisées sur l'intelligence artificielle et la représentation des connaissances.

DÉCOUVREZ LES AUTRES EXPERTS COVID-19 DU LIST:

 

 

Partager cette page :

Contact

Dr Cédric PRUSKI
Dr Cédric PRUSKI
Envoyer un e-mail