Récemment, Robin Li, PDG de Baidu, a souligné que l’IA est une énorme bulle insoutenable qui, tôt ou tard, finira par éclater. Cela indique que seulement 1% des entreprises du secteur survivront, ce qui est tout à fait logique.
Nous avons sûrement tous en tête les trois grands noms qui résisteront : Google, Meta et Microsoft. Je peux dire, sans crainte de me tromper, qu'OpenAI finira par être intégré au sein de Microsoft. Eh bien, c’est déjà le cas puisque Redmond a investi des milliards dans cette entreprise.
Qu'est-ce que le mode ordinateur Claude 3.5 ?
Anthropic a présenté une solution expérimentale qui permet à l'IA d'utiliser l'ordinateur. Le soi-disant « mode ordinateur » a la capacité de contrôler le bureau, d'interagir avec les applications et de les exécuter. Ce n’est pas quelque chose de nouveau, puisque plusieurs entreprises travaillent sur des solutions dotées d’IA capables de naviguer sur le Web ou d’exécuter des commandes logicielles.
Claude 3.5 est la première solution d'IA à implémenter ce type de fonctionnalité. Selon la société de développement, il a ainsi la capacité d'interpréter les écrans et d'exécuter des commandes comme s'il s'agissait d'une personne.
Plusieurs démonstrations ont été faites, qui sont assez surprenantes. A la capacité de programmer un site internet, exécuter des scripts sur un serveur utilisant VS Code, déboguez les erreurs et effectuez plusieurs actions différentes simultanément.
Cela a de grandes implications dans différents secteurs. Cela peut être une excellente solution pour automatiser des tâches administratives lourdes ou le développement de logiciels. Il a la capacité de simplifier des processus complexes qui nécessitent une intervention humaine constante.
Grâce à ce mode, Claude pouvait effectuer des recherches dans des bases de données, extraire des informations de feuilles de calcul ou remplir des formulaires. Tout cela pourrait être fait sans avoir recours à une supervision ou à une intervention humaine.
Donc, pour l’instant, vous allez continuer à jouer à des jeux vidéo avec une seule main. Il se concentre sur des tâches relativement simples et répétitives qui peuvent s’avérer coûteuses pour l’humain.
Bonne idée, mais c'est plutôt vert
Comme prévu, cette nouvelle fonctionnalité est loin d’être parfaite. Ce modèle commet des erreurs dans les actions de base, telles que le zoom ou le défilement. De plus, il ne gère pas très bien les notifications qui s'affichent à l'écran pendant une courte période.
Cela signifie qu’il nécessite une surveillance constante pour détecter les problèmes et les déficiences. Cela ne fonctionne pas non plus, pour le moment, pour les processus complexes. De plus, cela nécessite un apprentissage et une information constants en cas d’erreurs.
Nous ne pouvons pas oublier l’aspect sécurité, quelque chose de vraiment critique. Anthropic a souligné que si ces modèles sont attaqués avec des techniques de jailbreak, ils peuvent effectuer des actions nuisibles. Cela peut signifier que vous volez des informations pour un tiers sans le savoir ou que vous manipulez un processus causant des dommages.
Anthropic souligne qu'ils ont mis en place des mesures de sécurité supplémentaires. Ils indiquent qu'ils ajoutent la fonctionnalité permettant de conserver les captures d'écran pendant 30 jours ou de restreindre certaines fonctions critiques.
Reste maintenant à voir comment OpenAI, Salesforce et Microsoft répondront à cette solution. Ces sociétés développent depuis un certain temps des technologies similaires pour automatiser les processus logiciels.
Eh bien, Microsoft a déjà quelque chose comme ça avec Recall, la fonction controversée Copilot+ qui prend des captures d'écran toutes les 5 secondes de tout ce qui se passe à l'écran et qui peut compromettre les codes d'accès et les informations personnelles.