Dans le cadre d’une nouvelle collaboration internationale, le Luxembourg Institute of Science and Technology (LIST) et ADIA Lab, institut de recherche indépendant basé à Abu Dhabi et spécialisé en sciences des données et en calcul intensif, unissent leurs forces pour s’attaquer à l’un des angles morts les plus complexes de l’intelligence artificielle : comment tester, fiabiliser et encadrer les systèmes d’IA multi-agents.
Des outils de création de contenu au service client, les systèmes fondés sur des agents deviennent rapidement la norme. Pourtant, les méthodes actuelles d’évaluation restent centrées sur les agents individuels, laissant un vide critique quant à la compréhension de leurs comportements en interaction. La collaboration entre ADIA Lab et le LIST vise à combler cette lacune en développant une sandbox dédié à l’expérimentation, aux tests de résistance et à la gouvernance de flux de travail complexes basés sur l’IA.
« L’émergence de l’IA agentique ouvre d’immenses perspectives, mais elle comporte aussi des risques complexes que les modèles de test actuels – conçus pour des agents isolés – ne permettent pas d’anticiper, » explique Dr Horst Simon, directeur d’ADIA Lab. « Cette collaboration avec le LIST représente une étape clé dans la création des infrastructures nécessaires — tant conceptuelles que techniques — pour évaluer le comportement des systèmes multi-agents de manière holistique. Notre sandbox commune offrira un environnement sécurisé et maîtrisé permettant aux entreprises et aux chercheurs de tester ces systèmes avant leur déploiement dans le monde réel. »
Le LIST a déjà mis au point une AI Sandbox, un environnement unique conçu pour tester les modèles d’IA sur des critères tels que les biais, la robustesse, les performances en contexte multilingue, et bien plus encore.
« Nous avons développé une sandbox opérationnelle qui va bien au-delà des tests en laboratoire : elle nous permet d’analyser le comportement des modèles d’IA dans des contextes réalistes, multilingues et souvent imprévisibles », explique Francesco Ferrero, Responsable de l’Initiative stratégique sur l’intelligence artificielle du LIST. « Nous l’utilisons pour évaluer l’équité, la transparence, la robustesse et la performance des modèles dans des langues comme le luxembourgeois — trop souvent négligées. Ce qui manquait jusqu’ici, c’était un environnement structuré et sécurisé pour tester des systèmes multi-agents — dans lesquels les agents interagissent, évoluent, voire entrent en conflit. C’est ce que nous construisons avec ADIA Lab. Ensemble, nous faisons évoluer la sandbox pour permettre des tests systémiques, en toute sécurité, avant tout déploiement. »
Cette sandbox conjointe soutiendra la recherche sur les comportements émergents, les stratégies de coordination, les mécanismes de réduction des risques et les techniques de contrôle basées sur les prompts. Elle offrira également un cadre neutre et sécurisé où entreprises et institutions pourront tester leurs modèles avant déploiement. Les résultats seront diffusés publiquement à travers des publications et des actions conjointes, contribuant ainsi aux efforts internationaux en faveur d’une IA transparente et digne de confiance.
« Cette collaboration reflète l’ambition du Luxembourg de jouer un rôle actif dans le dialogue mondial sur l’IA de confiance », conclut Jurgen Joossens, Deputy CEO du LIST. « En unissant nos forces à celles d’ADIA Lab, nous construisons des ponts au-delà des frontières, favorisons les échanges scientifiques et contribuons à définir les normes internationales de gouvernance des technologies émergentes. »
Cette initiative renforce la position croissante du Luxembourg comme terrain d’essai fiable pour l’IA et leader en matière de recherche appliquée sur l’IA multilingue — comme en témoignent les récents travaux du LIST sur l’évaluation des modèles d’IA en luxembourgeois. Elle s’inscrit également dans le portefeuille croissant de collaborations scientifiques internationales d’ADIA Lab, qui compte notamment l’ETH Zurich, l’Université de Toronto, l’Université de Grenade, Minsait et Rigetti Computing.