Le nouvel agent d'IA d'OpenAI sera capable de réserver des billets, de commander de la nourriture et d'effectuer d'autres tâches sur des sites web à la place des utilisateurs.

Par: Nastya Bobkova | 24.01.2025, 06:30

OpenAI a présenté un nouvel agent d'intelligence artificielle, Operator, capable d'effectuer des tâches sur Internet à la place des utilisateurs.

Voici ce que nous savons

L'agent utilise son propre navigateur pour naviguer sur le web, cliquer sur des boutons, saisir du texte et faire défiler du contenu. Cela lui permet d'effectuer des tâches sur l'internet comme une personne qui clique sur des boutons, fait défiler des pages et saisit du texte sur des sites web. Dans un premier temps, le nouveau produit ne sera disponible que pour les abonnés de ChatGPT Pro aux États-Unis.

L'opérateur fonctionne sur un modèle spécial qui combine les capacités du GPT-4o et une formation approfondie. Cela lui permet non seulement de "voir" les pages par le biais de captures d'écran, mais aussi d'interagir avec les interfaces comme nous avons l'habitude de le faire avec une souris et un clavier.

Le plus intéressant est que l'agent ne se contente pas d'exécuter des tâches, mais qu'il peut aussi se corriger lui-même. Si quelque chose ne va pas, il vous donnera le contrôle du processus. Il vous demandera également la permission si le site requiert des informations sensibles (telles que des mots de passe) ou vous demandera votre accord avant d'envoyer un courrier électronique.

OpenAI s'est associée à des entreprises populaires comme Uber, DoorDash, Instacart et d'autres pour s'assurer que l'agent exécute des tâches réelles tout en respectant les normes de sécurité et d'éthique. Cependant, tout ne fonctionne pas parfaitement - des interfaces complexes telles que la création d'un diaporama lui sont encore difficiles.

Dans un futur proche, Operator sera disponible pour les utilisateurs des plans Plus, Team et Enterprise, et OpenAI prévoit d'intégrer cette technologie directement dans ChatGPT.

Source : OpenAI