Détection de la Covid-19 par la toux : résultats et futures perspectives

Publié le 28/10/2021

La détection de la Covid-19 à l’aide d’une simple analyse de la voix est une piste de recherche suivie par le Luxembourg Institute of Science and Technology depuis le début de la pandémie. En 2020, le projet avait suscité un vif intérêt, notamment dans les médias, suite à son appel à participants pour une enquête sur la voix et la toux.

Connue sous le nom de « COVID-19 Detection by Cough and Voice Analysis – CDCVA », cette recherche en partenariat avec le Luxembourg Institute of Health (LIH) et l'Université du Luxembourg a achevé sa première phase avec la publication de premiers résultats. « Le projet, d’une durée initiale de 6 mois,  a bénéficié d’une prolongation et s'est officiellement terminé le 15 avril. Les résultats sont maintenant publiés dans la revue Computers in Biology and Medicine », explique Muhannad Ismael, responsable du projet au LIST.

L’article, intitulé « Dectection of COVID-19 from voice, cough and breathing patterns : Dataset and preliminary results » a été soumis à ScienceDirect en août et publié en ligne en octobre.

Quels sont les résultats obtenus ? Et, quel a été l'impact de l'enquête CDCVA menée auprès du public ? Muhannad résume les trois principales avancées du projet :

  • Le nouvel ensemble de données provenant de l’enquête, constitué d'échantillons vocaux de toux, de parole et de respiration de personnes, permet de diagnostiquer les cas positifs à la Covid-19 et les personnes témoins en bonne santé.
  • Les résultats préliminaires pour la détection de la Covid-19 ont pu être établis à partir de modèles de toux, utilisant des ensembles de caractéristiques acoustiques standard, des caractéristiques de diffusion d'ondelettes, ainsi que des incorporations audios extraites de représentations de caractéristiques de bas niveau.
  • Les modèles du projet CDCVA ont atteint une précision de 88,52%, avec une sensibilité de 88,75% et une spécificité de 90,87%.

Les données, qui proviennent de 1 103 échantillons de volontaires à l’enquête, ont été recueillies à partir de cinq types de sons différents : la toux, le comptage, la lecture d'une phrase, l'inspiration et l'expiration, et le son de la voyelle « ahh ».

« Nous disposons de cinq types de sons différents, mais pour l'instant, nous n'avons analysé que la toux et n'avons pas étudié les autres données ; il serait donc intéressant de fusionner les sons pour obtenir davantage de données. Il est également important de mentionner qu’après avoir supprimé les éléments pour lesquels il manquait des fichiers audio, ou dont le son présentait un bruit de fond, un total de 1 103 participants ont été identifiés dans l'étude.  Par conséquent, nous avons écouté plus de 1 103 toux et nous n'avons pas eu le temps de le faire pour l'ensemble des données », précise Muhannad.

Pourquoi la toux ? « Parce qu'elle est très révélatrice des maladies respiratoires. L'un des principaux symptômes de la Covid-19 est une toux sèche, c'est pourquoi nous avons décidé de nous concentrer sur cet aspect pour le moment », ajoute Muhannad.

Une fois les données collectées, et avant qu'elles ne soient classées, les chercheurs peuvent visualiser sous forme de graphiques les caractéristiques des signaux dérivés de la toux des personnes diagnostiquées comme infectées par la Covid-19 et des sujets sains à l’aide d'outils spécifiques.

« Nous avons une application où nous avons des participants – un nombre pas très élevé mais tout de même 1 103 personnes jusqu’au 25 mars - qui ont pris part à l’enquête. 7,62 % d'entre eux se sont révélés positifs. Après cela, différentes méthodes ont été appliquées. Nous avons pris le signal sonore. Nous avons ensuite produit des spectrogrammes, ou extrait les ensembles de caractéristiques acoustiques standard ou celles de diffusion par ondelettes, qui ont alors été appliquées dans différentes méthodes de classification », explique Muhannad.

La prochaine étape : plus de données sont nécessaires !

Bien que le projet dispose de premiers résultats, ces derniers n’ont pas encore été validés. « Nous avons fait un pas en avant, et notre ‘data engine’ est déjà complet. Mais, nous avons besoin de plus de données pour continuer à valider notre méthode. Pour l’instant, nous n’avons pas eu un grand nombre de participants. Nous disposons d'un ensemble de données sur des personnes en bonne santé ou atteintes de la Covid-19. Ce qu'il nous faut maintenant, c'est davantage de données provenant de personnes atteintes d'autres maladies, comme la grippe par exemple », témoigne Muhannad.

La participation d'un plus grand nombre de personnes atteintes d'une grippe, ou d'autres maladies du répertoire, permettrait de les identifier ou de les isoler des données et donc de concentrer l'étude uniquement sur la Covid-19.

L'étape suivante consisterait à proposer un prototype complet. « Nous pourrions donc avoir une application qui prend un échantillon sonore de la toux au début, et qui donne un résultat à la fin. L'idée serait d'informer les gens pour qu'ils essaient notre application afin de déterminer s'ils ont le Covid-19 ou non », souligne Muhannad.

Comment participer

Vous pouvez dès à présent participer à l’enquête en ligne du projet, disponible en 8 langues. Cette dernière est totalement anonyme. Elle garantit la sécurité et l'intégrité des données personnelles, conformément à la législation applicable en matière de protection des données.

En participant, vous soutenez le LIST, le LIH et l'Université du Luxembourg dans le cadre du projet CDCVA pour parvenir à la prochaine étape de la recherche.

Retrouvez l’ensemble des informations sur le site internet de CDCVA : cdcva.list.lu

Choisissez un lien dans votre langue :

Partager cette page :

Contact

Dr Muhannad ISMAEL
Dr Muhannad ISMAEL

Department: IT for Innovative Services (ITIS)

Envoyer un e-mail