OpenAI présente son nouvel outil baptisé Aardvark. Il est décrit comme un chercheur en sécurité agentique. S'appuyant sur le modèle GPT-5, cet agent IA a pour mission d'assister les équipes de développeurs et de sécurité, en découvrant et en aidant à combler les vulnérabilités à grande échelle.

Comment fonctionne Aardvark ?

Contrairement aux techniques traditionnelles comme le fuzzing, Aardvark utilise le raisonnement et l'utilisation d'outils propres aux grands modèles de langage pour analyser le code à la manière d'un expert humain.

Son processus se déroule en plusieurs étapes clés. D'abord, il analyse l'intégralité du code pour en comprendre les objectifs et le design. Ensuite, il surveille en continu les modifications et les nouveaux commits pour y déceler des failles potentielles.

Lorsqu'une vulnérabilité est suspectée, Aardvark tente de l'exploiter dans un environnement isolé et sécurisé (sandbox) pour confirmer son existence. Il s'intègre à OpenAI Codex pour proposer un patch correctif, prêt à être examiné et appliqué par un développeur.

openai-aardvark

De premiers résultats avec Aardvark

Aardvark a déjà été utilisé depuis plusieurs mois en interne chez OpenAI et chez des partenaires. Lors de tests sur des bases de code de référence, il aurait réussi à identifier 92 % des vulnérabilités connues et introduites artificiellement.

Son action a également eu un impact sur l'écosystème open source, où il a permis de découvrir des failles ayant conduit à une dizaine d'identifiants CVE (Common Vulnerabilities and Exposures).

Aardvark serait en outre capable de repérer des problèmes ne survenant que dans des conditions complexes.

Une bêta privée pour Aardvark

Avec plus de 40 000 vulnérabilités CVE signalées pour la seule année 2024, la charge de travail des experts humains est colossale.

Aardvark représente ce qu'OpenAI nomme " un nouveau modèle axé sur le défenseur ", offrant une protection continue qui s'adapte à l'évolution du code et une collaboration.

OpenAI ouvre une bêta privée et invite les organisations et projets open source intéressés à candidater pour tester et affiner les capacités d'Aardvark.