Recherche

L'agent S de Simular surpasse les humains sur OSWorld Benchmark

L'agent IA atteint 72,6 % sur OSWorld, dépassant le niveau de référence humain de 72,36 %

16 décembre 2025

San Francisco, Californie — Simular, la société informatique autonome, a annoncé aujourd'hui que son framework agentique ouvert Agent S avait atteint un Taux de réussite de 72,6 % sur OS World, la référence de référence en matière d'évaluation des agents multimodaux effectuant de véritables tâches informatiques.

Ce jalon place l'agent de Simular au-dessus de celui de l'indice de référence performance au niveau humain de 72,36 %, marquant une avancée majeure dans la capacité de l'IA à faire fonctionner de vrais ordinateurs avec une fiabilité comparable à celle d'un humain.

Il y a tout juste un an, le score le plus élevé sur OSWorld oscillait autour de 20 %. Les progrès continus ont rapidement amélioré les performances dans le domaine des agences. L'Agent S de Simular est le premier à dépasser le seuil humain, en grande partie grâce aux effets d'échelle de Comportement Best-of-N (BBon), une méthode qui améliore les performances en utilisant plusieurs agents et en sélectionnant les meilleurs d'entre eux.

« Le domaine des agents informatiques évolue si rapidement que nous n'avions même pas prévu que cette avancée arriverait si tôt », a déclaré Ang Li, PDG et cofondateur de Simular. « Jusqu'à récemment, il n'était pas clair si l'IA pouvait utiliser un ordinateur de manière fiable comme le font les humains. Franchir ce seuil est un moment historique. Notre objectif est désormais de rendre cette technologie largement accessible, en débloquant des cas d'utilisation réels pour de vraies personnes sur de vrais ordinateurs. »

Cette étape fait suite au récent cycle de financement de 21,5 millions de dollars de Simular dirigé par Felicis avec la participation de NVentures de Nvidia, Basis Set Ventures et d'autres. Simular est également l'une des cinq agences sélectionnées pour piloter le nouveau logiciel de Microsoft Windows 365 pour les agents, un environnement sécurisé et évolutif conçu pour l'automatisation de l'IA au niveau de l'entreprise.

En décembre, la société a lancé Similaire 1.0, le premier agent d'intelligence artificielle véritablement conçu pour les ordinateurs de bureau destiné aux consommateurs, une étape vers sa mission qui consiste à libérer complètement les utilisateurs du travail informatique.

Pour en savoir plus, lisez le document de recherche complet TL'efficacité déraisonnable des agents de détartrage pour une utilisation sur ordinateur: https://arxiv.org/abs/2510.02250

Construire des ordinateurs autonomes ne signifie pas remplacer les humains. Cela signifie coopération.

Consultez le référentiel Open Source Agent S