Flux RSS VentureBeat Note

Flux RSS VentureBeat

VentureBeat est un site de nouvelles et d'analyse technologiques bien établi qui se concentre sur la couverture de l'innovation et du monde en constante évolution de la technologie, de la science et de l'avenir du travail. Le site offre des reportages précis, des analyses de marché approfondies et des commentaires éclairés sur les opportunités et les défis des technologies émergentes. Il couvre un large éventail de sujets, y compris l'IA, la robotique, la blockchain, le jeu vidéo, et bien plus encore. Sa couverture inclut des actualités brèves, des histoires en vedette et des contributions d'invités, créant une gamme variée de contenu pour les lecteurs.

Fil de notes

Les agents d'IA, dont l'importance est prévue pour 2025, rencontrent des difficultés à accomplir efficacement des tâches en plusieurs étapes. Le cadre EAGLET, développé par des chercheurs, vise à améliorer les performances de ces agents sur des tâches à long terme. EAGLET utilise un "planificateur global" pour guider les agents, atténuant les erreurs de planification sans nécessiter d'étiquetage manuel des données ni de recyclage. Ce planificateur, affiné grâce à un processus en deux étapes, génère un plan de haut niveau pour réduire les hallucinations et améliorer l'efficacité. Une innovation clé est la récompense de gain de capacité d'exécution (ECGR), qui mesure l'efficacité des plans générés. Le cadre est conçu pour être facilement intégré dans les flux de travail des agents existants, améliorant les performances sur divers modèles. EAGLET a surpassé d'autres méthodes de planification lors de tests de référence tels que ScienceWorld et ALFWorld. La recherche démontre des taux d'achèvement des tâches améliorés et une réduction du nombre d'étapes nécessaires à l'exécution. Bien qu'il soit prometteur, le code n'est pas encore accessible au public, ce qui soulève des questions concernant sa mise en œuvre. Le déploiement en entreprise est confronté à des défis supplémentaires concernant la facilité d'intégration, ce qui nécessite une enquête plus approfondie sur l'application pratique. Malgré ces considérations, EAGLET offre une stratégie prometteuse pour améliorer la fiabilité et l'efficacité des agents LLM.
CdXz5zHNQW_QiHfat30sX.png
Visa a introduit le protocole Trusted Agent pour relever le défi de distinguer les assistants d'achat IA légitimes des bots malveillants. Ce protocole établit une infrastructure fondamentale pour le commerce agentique, où les agents IA recherchent, comparent et achètent des produits de manière autonome. Les commerçants peuvent désormais vérifier cryptographiquement que ces agents IA sont autorisés et dignes de confiance, empêchant ainsi l'extraction de données et la fraude. Le trafic généré par l'IA vers les sites de vente au détail a considérablement augmenté, submergeant les systèmes de détection de bots existants. Le protocole de Visa utilise une poignée de main de confiance cryptographique, exigeant que les agents IA soient contrôlés et reçoivent une clé de signature numérique unique. Les agents approuvés transmettent ensuite des informations sur leur intention, la reconnaissance du consommateur et des détails de paiement facultatifs. Les commerçants valident ces signatures pour confirmer la fiabilité des agents, avec des modifications minimales de l'infrastructure existante. Visa collabore avec des entreprises comme Cloudflare et s'engage avec des concurrents comme Google et OpenAI pour établir des normes industrielles. Le protocole soulève des questions sur la responsabilité des transactions non autorisées, mais Visa met l'accent sur ses systèmes de protection contre la fraude. Le rôle de gardien de Visa dans l'approbation des agents IA pourrait être controversé, favorisant potentiellement les grandes entreprises. Le protocole est lancé au milieu des défis juridiques de Visa concernant les frais de balayage des cartes de crédit et les enquêtes sur le routage des cartes de débit. Visa reconnaît qu'une adoption généralisée prendra du temps, en se concentrant sur l'établissement de la crédibilité et la démonstration de la valeur. Les prédictions des analystes suggèrent que l'adoption par les commerçants dépendra de la croissance des agents IA dans la réalisation des transactions. L'investissement de Visa dans l'IA pour la réduction de la fraude et son expansion dans de nouveaux domaines de paiement, comme le partenariat avec X pour un portefeuille numérique, soulignent son orientation stratégique sur l'IA.
CdXz5zHNQW_X2wIYWRpyF.webp
Le Rose Rock Bridge (RRB) de Tulsa Innovation Labs est un incubateur de startups à but non lucratif qui s'appuie sur l'héritage de l'industrie énergétique de Tulsa pour favoriser les technologies énergétiques durables. RRB vise à créer une économie technologique florissante en combinant l'expertise locale avec les nouveaux talents entrepreneuriaux. Le programme s'associe à des acteurs majeurs pour fournir des ressources aux startups en phase de démarrage qui résolvent des problèmes énergétiques urgents. RRB a déjà accéléré de nombreuses entreprises, obtenu des projets pilotes et facilité des contrats clients, ce qui a permis d'obtenir des financements importants. Le Rose Rock Bridge Showcase est un concours de présentation axé sur la commercialisation, et pas seulement sur le financement, avec des partenaires industriels tels que Williams, ONEOK, Devon Energy et Helmerich and Payne. Les startups sélectionnées concourent pour des opportunités de projets pilotes et des investissements potentiels, en mettant l'accent sur les solutions aux défis tels que le gaz naturel à faible teneur en carbone. Les lauréats reçoivent un financement non dilutif, des services de soutien et des opportunités de projets pilotes pour accélérer l'intégration sur le marché. La cohorte de cette année se concentre sur les innovations dans des domaines tels que l'analyse chimique assistée par l'IA, la réduction des émissions, la conversion des déchets et l'inspection robotique. Tulsa Innovation Labs soutient ces entreprises par le biais d'espaces de laboratoire, de collaborations de recherche, de liens de financement et de mentorat. RRB se consacre à "polir" les startups, en les préparant à l'entrée sur le marché grâce à des programmes pilotes et à des services de soutien.
CdXz5zHNQW_OpzZStVR80.jpeg
Des chercheurs du MIT ont développé SEAL, une technique novatrice permettant aux grands modèles linguistiques comme ceux utilisés par ChatGPT de s'améliorer eux-mêmes. SEAL permet aux LLM de générer des données synthétiques et de formuler leurs propres stratégies de réglage fin, atteignant ainsi l'auto-adaptation. Cette méthode, contrairement aux modèles traditionnels, ne repose pas uniquement sur des données externes et des processus conçus par l'homme. Le document élargi et le code open-source publiés le mois dernier ont suscité un intérêt considérable dans la communauté de l'IA. SEAL est structuré avec deux boucles : une boucle interne affine en utilisant des modifications auto-générées, et une boucle externe utilise l'apprentissage par renforcement pour optimiser la politique de génération de modifications. Les performances ont été évaluées sur des tâches d'incorporation de connaissances et d'apprentissage par quelques exemples, montrant des améliorations significatives de la précision. La technologie aide les modèles à restructurer les connaissances avant l'assimilation, de manière similaire aux processus d'apprentissage humains. Bien que des résultats solides aient été obtenus, les défis incluent l'oubli catastrophique potentiel et la surcharge computationnelle pendant le réglage fin. Néanmoins, la capacité de SEAL à créer des données d'entraînement de haute utilité et à généraliser dans différents scénarios est prometteuse. Les chercheurs envisagent des applications dans le pré-entraînement autonome et le développement de systèmes d'IA plus autonomes. Ce travail représente une étape vers l'évolution autonome des LLM, abordant potentiellement les limitations de données et conduisant à des améliorations.
CdXz5zHNQW_YBrQHHj9O8.png
Les entreprises sont souvent confrontées à un problème lors du réglage fin des grands modèles linguistiques (LLM) où les modèles perdent des capacités précédemment acquises, un phénomène connu sous le nom d'oubli catastrophique. Des chercheurs de l'Université de l'Illinois à Urbana-Champaign ont proposé une nouvelle méthode pour éviter cela, en se concentrant sur la réadaptation de seulement des parties restreintes du LLM. Cette approche vise à réduire les coûts de calcul et à préserver les connaissances existantes du modèle. L'équipe suggère que l'oubli catastrophique n'est pas une véritable perte de mémoire, mais un effet secondaire de la dérive des biais. Ils ont étudié cela en entraînant deux LLM vision-langage, LLaVA et Qwen 2.5-VL, sur des tâches spécifiques et en observant leurs performances sur des benchmarks tenus à l'écart. Étonnamment, ils ont constaté que le réglage fin des seules couches de projection d'auto-attention entraînait l'apprentissage de nouvelles tâches sans baisse de performance sur les tâches existantes. La recherche indique que le réglage fin du perceptron multicouche (MLP) peut provoquer des biais de sortie et un oubli temporaire. En réglant sélectivement des composants MLP spécifiques tout en en gardant d'autres figés, ils ont obtenu un apprentissage efficace avec un minimum d'oubli. Cette méthode de réadaptation restreinte offre un moyen plus rentable et plus contrôlable de mettre à jour les LLM. Bien que la recherche actuelle soit limitée aux modèles vision-langage, les résultats devraient être applicables à d'autres LLM dans différentes modalités.
CdXz5zHNQW_ErvqWM29Xr.png
CdXz5zHNQW_BgoeY8QHcg.webp
Salesforce lance Agentforce 360 à Dreamforce, en se concentrant sur les agents intelligents pour révolutionner les opérations commerciales. Cette initiative vise à transformer les entreprises en "entreprises agissantes", avec l'IA gérant jusqu'à 40 % du travail aux côtés des humains. Cette démarche répond au problème généralisé de l'industrie où la plupart des projets d'IA d'entreprise sont bloqués avant la production. La solution de Salesforce intègre Agentforce 360, Data 360, des applications Customer 360 et Slack en tant qu'interface utilisateur principale. Slack deviendra le hub central pour les fonctions Salesforce, remplaçant les tableaux de bord traditionnels par des interactions conversationnelles. La plateforme comprend des agents intelligents pour les ventes, l'informatique, les ressources humaines et l'analyse, ainsi qu'un Slackbot repensé. L'entreprise élargit également ses interactions basées sur la voix et le service informatique pour les employés, défiant directement ServiceNow. Les premiers adoptants signalent des gains d'efficacité importants, avec des améliorations des temps de résolution, des économies de coûts et des cas déviés. Salesforce met l'accent sur la "couche de confiance" avec des traces d'audit et une conformité pour surveiller le comportement des agents. Data 360 améliore l'accessibilité des données grâce à l'IA, et Salesforce collabore avec diverses entreprises pour la standardisation. L'initiative est confrontée à la concurrence d'autres géants de la technologie qui investissent dans l'IA. Salesforce estime que la différenciation réside dans l'intégration de l'IA avec les processus commerciaux et les données pour une convivialité utilisateur. Bien que les histoires de réussite des clients soient prometteuses, l'adoption est encore en développement, et le cours de l'action suggère que le scepticisme des investisseurs persiste. Dreamforce sera déterminant pour savoir si Salesforce peut considérablement accroître l'adoption de l'IA d'entreprise.
CdXz5zHNQW_6R9jiLIrcx.webp
CdXz5zHNQW_1xNMCQBaRf.png
CdXz5zHNQW_Baj9HN4qBo.png
Les outils d'IA transforment le développement logiciel en automatisant les tâches et en générant du code, réduisant potentiellement le besoin de grandes équipes d'ingénieurs. Des inquiétudes surgissent quant à une dépendance excessive à l'IA qui pourrait diminuer l'expertise humaine en codage et les compétences en résolution de problèmes chez les développeurs juniors. Des outils tels que Claude Code, AutoGen et Semantic Kernel automatisent la détection de bugs, le refactoring de code et la création de flux de travail. Cette automatisation pourrait limiter les opportunités pour les codeurs juniors de perfectionner leurs compétences par des méthodes traditionnelles de résolution de problèmes. Cependant, l'IA peut également être utilisée comme un mentor interactif, fournissant des retours en temps réel et des explications pour guider les développeurs. Le codage assisté par l'IA, lorsqu'il est utilisé comme outil de formation, peut renforcer l'apprentissage en expliquant les erreurs et en suggérant des améliorations. Les entreprises et les éducateurs devraient structurer les programmes de développement autour de ces outils, en mettant l'accent sur la compréhension du code et le refactoring manuel. L'IA devrait servir de partenaire de formation plutôt que de béquille, augmentant les capacités humaines. Une utilisation intentionnelle de l'IA dans le codage peut combler le fossé entre l'automatisation et l'éducation, favorisant une génération de codeurs compétents et adaptables. En adoptant l'IA comme mentor, nous pouvons permettre aux développeurs de grandir aux côtés des outils qu'ils utilisent.
CdXz5zHNQW_RTrJdA5uEl.png
ScottsMiracle-Gro, une entreprise horticole centenaire, exploite l'intelligence artificielle pour obtenir un avantage concurrentiel significatif. Initialement basée sur des méthodes manuelles pour la gestion des stocks, l'entreprise est passée à l'utilisation de drones et de l'IA pour des calculs précis des volumes. Ce changement marque une transformation technologique plus large, défiant les attentes d'un leadership en IA provenant des entreprises traditionnelles de biens de consommation emballés. Sous la direction de Nate Baxter, un vétéran des semi-conducteurs, ScottsMiracle-Gro a réalisé des économies substantielles et amélioré le service client grâce à la mise en œuvre de l'IA. Baxter a vu des parallèles entre la fabrication de semi-conducteurs et les opérations de l'entreprise, reconnaissant le potentiel inexploité de ses vastes connaissances horticoles. Il a déclaré ScottsMiracle-Gro une entreprise technologique, initiant une restructuration organisationnelle qui a intégré les équipes informatiques, de la chaîne d'approvisionnement et de la marque. L'entreprise a entrepris une numérisation massive des données et le développement de modèles d'IA, notamment la création d'agents spécialisés pour comprendre les nuances des produits. Cette intégration de l'IA s'étend à la prévision de la demande, à la gestion des stocks avec des drones et aux services aux consommateurs, permettant une réaffectation rapide des ressources basée sur l'analyse prédictive. Le succès de ScottsMiracle-Gro souligne le pouvoir de combiner l'IA générale avec des connaissances propriétaires du domaine, remettant en question les hypothèses traditionnelles de l'industrie. Les projets futurs de l'entreprise comprennent une application "sommelier du jardinage" et une communication d'agent à agent avec les partenaires de vente au détail. Cette transformation offre un modèle pour les entreprises traditionnelles afin d'utiliser l'IA pour les impératifs commerciaux, faisant des connaissances héritées un facteur de différenciation stratégique.
CdXz5zHNQW_wubKoMK3T8.png
Les cybercriminels et les acteurs étatiques utilisent l'IA comme une arme pour exploiter les vulnérabilités des systèmes en trois jours, un rythme rapide qui dépasse les méthodes traditionnelles de correction manuelle. Les fournisseurs reconfigurent désormais l'infrastructure de sécurité, du noyau vers le haut, pour lutter contre cette menace. La nouvelle version 25.X de Connect Secure d'Ivanti, construite sur Oracle Linux renforcé avec SELinux, démontre ce passage vers une sécurité avancée au niveau du noyau. Les chercheurs ont prouvé la réalité de ces risques d'exploitation, présentant des contournements d'authentification dans des produits de sécurité majeurs. La compromission du noyau accorde aux attaquants un contrôle total d'un appareil et, par conséquent, d'un réseau entier, contournant toutes les autres couches de sécurité. L'approche d'Ivanti comprend des mesures telles que le démarrage sécurisé, le chiffrement du disque et un serveur web sécurisé moderne pour dissuader les menaces. Au-delà de la sécurité du noyau, les technologies émergentes comme eBPF offrent une visibilité et une sécurité accrues sans dépendre uniquement des agents du noyau. La correction automatisée et progressive par le biais d'un "déploiement en anneau" est également cruciale pour résoudre la crise de vitesse dans la gestion des vulnérabilités. Les organisations doivent donner la priorité à l'automatisation de la correction, à l'audit de la sécurité au niveau du noyau et à la superposition des défenses pour réduire leur surface d'attaque. La transparence des fournisseurs concernant les incidents de sécurité devient également de plus en plus importante. En fin de compte, la transformation au niveau du noyau est essentielle pour survivre à l'ère des cyberattaques pilotées par l'IA.
CdXz5zHNQW_CSkk4sTJEU.jpeg
Les entreprises déployant l'IA rencontrent des limitations de performance dues à des spéculateurs statiques qui ne peuvent pas s'adapter à l'évolution des charges de travail. Ces spéculateurs fonctionnent avec de grands modèles linguistiques pour rédiger plusieurs jetons à l'avance, améliorant considérablement la vitesse d'inférence et réduisant les coûts. Ensemble, l'IA a introduit ATLAS, un nouveau système doté d'un apprentissage adaptatif pour l'optimisation de l'inférence, promettant des performances jusqu'à 400 % plus rapides. Les spéculateurs statiques, entraînés sur des ensembles de données fixes, perdent en précision à mesure que les modèles d'utilisation de l'IA changent, entraînant une dégradation des vitesses d'inférence. ATLAS emploie une architecture à double spéculateur avec un modèle statique stable et un modèle adaptatif léger qui apprend du trafic en direct. Un contrôleur conscient de la confiance sélectionne dynamiquement le spéculateur approprié, permettant un ajustement dynamique de l'anticipation de la spéculation. Cette approche adaptative offre des performances comparables à celles de matériel spécialisé comme les puces personnalisées, atteignant des taux de génération de jetons élevés. Les gains de performance proviennent d'une meilleure utilisation de la capacité de calcul en échangeant le traitement inactif contre une réduction de l'accès à la mémoire. ATLAS fonctionne comme une couche de mise en cache intelligente, apprenant des modèles plutôt que de stocker des réponses exactes. Les cas d'utilisation incluent l'entraînement à l'apprentissage par renforcement et l'adaptation aux applications d'IA d'entreprise en évolution. ATLAS est désormais disponible sur la plateforme de Together AI sans coût supplémentaire, indiquant un changement plus large de l'industrie vers des systèmes d'inférence en apprentissage continu.
CdXz5zHNQW_iLEz2YDwJK.jpeg
Raindrop, une startup spécialisée dans l'observabilité des applications d'IA, a lancé "Experiments", une suite de tests A/B spécialement conçue pour les agents d'IA d'entreprise. Cette nouvelle fonctionnalité permet aux entreprises de comparer les performances de différents agents d'IA en fonction des changements apportés aux modèles sous-jacents, aux instructions et à l'accès aux outils. Experiments étend les outils existants de Raindrop, offrant des informations sur le comportement et l'évolution des agents d'IA lors des interactions réelles avec les utilisateurs. La plateforme suit l'impact des changements sur les performances de l'IA à travers des millions d'interactions, visualisant les résultats et mettant en évidence les signaux positifs et négatifs. Cet outil vise à apporter la rigueur du déploiement logiciel moderne à l'itération des agents d'IA, en favorisant les améliorations basées sur les données. La mission principale de Raindrop a été de résoudre le "problème de la boîte noire" en IA, en aidant les équipes à comprendre pourquoi et comment leurs systèmes d'IA échouent. Experiments aborde le problème courant des "évaluations réussies, agents défaillants" en se concentrant sur le comportement réel des agents. La plateforme propose des données faciles à interpréter qui aident les développeurs à identifier et à corriger rapidement les problèmes, tels que les échecs de tâches ou les erreurs inattendues. Experiments s'intègre aux plateformes de drapeaux de fonctionnalités et aux pipelines d'analyse existants, garantissant des comparaisons précises avec des données utilisateur suffisantes. Raindrop offre une sécurité des données complète, y compris des options de suppression des informations personnelles et la conformité SOC 2, ainsi que divers plans tarifaires. L'entreprise met l'accent sur l'amélioration continue, dans le but d'aider les développeurs à aller plus vite et à déployer des modèles d'IA plus performants en privilégiant les données réelles des utilisateurs.
CdXz5zHNQW_gsijoDfwgk.png
Des chercheurs chez Nvidia ont développé une nouvelle technique appelée pré-entraînement par apprentissage par renforcement, qui intègre l'apprentissage par renforcement dans la phase d'entraînement initiale des grands modèles linguistiques. Cette approche encourage le modèle à réfléchir de manière indépendante avant de prédire la suite, lui apprenant à raisonner sur du texte brut sans avoir besoin de vérificateurs externes. Le cycle d'entraînement typique des grands modèles linguistiques implique un pré-entraînement sur de vastes quantités de texte en utilisant un objectif de prédiction du prochain jeton, suivi d'une phase de post-entraînement où ils acquièrent des capacités de raisonnement complexes. Cependant, ce processus séquentiel ne correspond pas à la compréhension humaine, qui est une intégration parallèle de l'entrée avec les connaissances antérieures. La nouvelle technique, RLP, recadre le processus de pré-entraînement en traitant la génération de chaînes de pensée comme une action que le modèle entreprend avant de prédire le prochain jeton. Le modèle reçoit une récompense en fonction de la mesure dans laquelle sa pensée a amélioré la précision de sa prédiction, éliminant ainsi le besoin de vérificateurs externes ou de données étiquetées par des humains. Le RLP a montré des améliorations significatives dans l'apprentissage de tâches de raisonnement complexes, les modèles entraînés avec cette technique surpassant systématiquement leurs homologues entraînés conventionnellement. Les avantages du RLP se cumulent au lieu de disparaître lors des étapes ultérieures de réglage fin, et la technique démontre une évolutivité et une polyvalence impressionnantes. Les chercheurs pensent que le RLP ouvre la voie à un avenir où le pré-entraînement ne sera plus un processus monolithique de prédiction du prochain jeton, mais plutôt un hybride d'objectifs qui crée une IA apprenant à penser de manière plus robuste dès le premier jour. Dans l'ensemble, le RLP a le potentiel de révolutionner la façon dont les grands modèles linguistiques sont entraînés, leur permettant de développer une pensée plus profonde et plus structurée beaucoup plus tôt dans l'entraînement.
CdXz5zHNQW_Vkfqey1VGn.webp
La conférence des développeurs d'OpenAI a présenté des avancées passionnantes en matière d'IA, mais la sortie de Codex, leur ingénieur logiciel IA, a sans doute été l'annonce la plus importante. Codex, désormais généralement disponible, est conçu pour créer des outils, démontrant la stratégie d'OpenAI pour dominer le marché des entreprises. Cette version comprend un nouveau SDK, une intégration Slack et des contrôles de sécurité, ce qui témoigne de sa préparation pour les tâches critiques des entreprises. Propulsé par GPT-5-Codex, le modèle d'IA permet un codage autonome et offre des gains de productivité importants, notamment l'achèvement de tâches complexes de longue durée. Les ingénieurs d'OpenAI utilisent Codex quotidiennement, ce qui a entraîné une augmentation de 70 % des contributions hebdomadaires de code, soulignant son rôle central. Codex est fondamental pour la création des autres produits d'IA d'OpenAI, y compris les outils personnalisés présentés lors de la conférence. Une caractéristique clé est sa capacité de revue de code, qui détecte des centaines de bogues quotidiennement et permet de gagner du temps. OpenAI donne la priorité à la conquête de clients d'entreprise avec Codex, comme l'a souligné le PDG Sam Altman. Des entreprises comme Cisco bénéficient déjà de Codex, avec une revue de code et des délais de projet plus rapides. Le nouveau SDK permet aux entreprises d'intégrer Codex dans des flux de travail personnalisés, créant ainsi des applications en constante évolution. Alors que d'autres annonces ont capté l'attention du public, Codex représente un changement tangible dans le développement de logiciels.
CdXz5zHNQW_MNllv1dkpu.webp
CdXz5zHNQW_1rTnrgkqAP.png
Zendesk est une plateforme de service client qui traite des milliards de résolutions chaque année, avec un accent important sur les solutions basées sur l'IA. L'entreprise investit massivement dans la recherche et le développement, en particulier pour sa plateforme de résolution, une solution axée sur l'IA pour le service client. Zendesk a récemment annoncé des avancées significatives, notamment des agents vocaux IA et des appels vidéo au sein de son centre de contact. Leurs agents IA peuvent désormais gérer plusieurs intentions et travailler sur les canaux de messagerie, de courriel et vocaux avec une assurance qualité intégrée. Admin Copilot de Zendesk aide les agents humains en identifiant et en corrigeant les problèmes opérationnels au sein de la plateforme. Les connecteurs de connaissances permettent aux administrateurs d'intégrer du contenu externe, tandis que Action Builder crée des boucles de rétroaction plus intelligentes pour les équipes produit. Une caractéristique clé est Zendesk HyperArc, qui combine l'IA et l'analyse humaine pour fournir des informations claires. La plateforme propose des solutions pour la vente au détail, avec des fonctionnalités telles que les agents vocaux IA et les appels vidéo pour un service personnalisé. Les responsables informatiques bénéficient d'avantages importants avec la gestion des actifs informatiques, offrant un service proactif aux employés. Zendesk s'engage à innover, en améliorant continuellement sa plateforme et en offrant des solutions pour divers besoins de service client.
CdXz5zHNQW_ZJJLTb0fIz.png
Les entreprises de services professionnels ont du mal à répondre à la demande en raison d'une capacité humaine limitée. Les logiciels traditionnels d'automatisation des services professionnels (PSA) ont des limites. Le PSA autonome, alimenté par des agents d'IA, offre une nouvelle solution. Ce modèle combine l'expertise humaine avec la main-d'œuvre numérique et l'orchestration centrale, élargissant les capacités de prestation de services. Contrairement à l'automatisation, l'autonomie se concentre sur l'exécution axée sur les objectifs, ce qui est crucial pour les opérations de services complexes. Le PSA autonome répond à la complexité des modèles économiques des services professionnels, libérant un potentiel de revenus important. Salesforce fournit une plateforme unifiée pour le PSA autonome, intégrant les données clients, les agents d'IA et une solution PSA native. Le moteur d'orchestration gère une main-d'œuvre hybride, améliorant la dotation en personnel et les résultats des projets. Ce système permet aux entreprises d'augmenter la saisie des prospects, d'améliorer la rentabilité et d'accélérer les délais des projets. La préparation au PSA autonome implique la réarchitecture de la main-d'œuvre, l'investissement dans un moteur d'orchestration natif et l'expérimentation de l'automatisation. L'opportunité de marché potentielle est substantielle, avec des gains de revenus importants possibles. Les entreprises adoptant le PSA autonome peuvent capter davantage de demande, améliorer les résultats et améliorer la réussite des clients. Le passage aux services professionnels autonomes se produit maintenant, et le moteur d'orchestration est la clé du succès.
CdXz5zHNQW_KJPJdfYPUJ.jpeg
Un nouveau rapport G2 révèle que les agents d'IA sont beaucoup plus performants qu'on ne le pensait auparavant, avec près de 60 % des entreprises qui les utilisent en production et moins de 2 % qui échouent. Ces données contredisent les rapports universitaires précédents qui suggéraient une stagnation généralisée des projets d'IA. Le rapport a interrogé plus de 1 300 décideurs B2B, soulignant des taux de satisfaction élevés et des économies de coûts importantes, en particulier dans le service client, la BI et le développement logiciel. Malgré le succès, une "égalité parfaite" existe entre les modèles autonomes et hybrides, les entreprises équilibrant souvent la supervision humaine. L'autonomie complète est plus acceptée dans les flux de travail à faible risque, comme la gestion des données. Les entreprises investissent également massivement dans les agents d'IA, la majorité prévoyant d'augmenter leurs investissements au cours de l'année prochaine. Agentforce, un produit Salesforce, est en tête du marché, mais beaucoup visent à développer des outils en interne. Les agents d'IA améliorent l'efficacité en surmontant les défis humains comme la procrastination, permettant des flux de travail plus rapides avec un travail constant. La sécurité est une préoccupation majeure, car près de 40 % ont signalé des incidents de sécurité. L'explicabilité est essentielle pour instaurer la confiance et se concentrer sur les problèmes commerciaux avant la mise en œuvre. La confiance dans l'IA, comme pour le cloud computing, est un processus progressif qui nécessite une communication ouverte et des données. Les entreprises doivent donner la priorité à la mesure et à la formation rapide suite à toute erreur d'agent. Par conséquent, aborder le déploiement correctement et atténuer les problèmes de confiance potentiels peut mener au succès.
CdXz5zHNQW_mol982FVCh.png
Le protocole Model Context Protocol (MCP), initialement salué pour son adoption rapide en tant que standard d'intégration de l'IA, est devenu une vulnérabilité majeure en matière de cybersécurité en raison de sa conception. Les recherches de Pynt révèlent un effet réseau dangereux : plus il y a de plugins MCP utilisés, plus le risque d'exploitation est exponentiellement élevé. La connectivité sans friction, le principal atout de MCP, a favorisé un manque de sécurité, l'authentification étant initialement facultative et les mises à jour d'autorisation arrivant tardivement. Cela a conduit à une surface d'attaque croissante où les connexions amplifient les vulnérabilités, créant un risque pour la chaîne d'approvisionnement. Les chercheurs ont identifié des exploits réels, notamment l'exécution de commandes et l'exfiltration de données, soulignant la gravité du problème. L'absence de sécurité intégrée permet aux attaquants de contrôler potentiellement les assistants IA via des outils compromis. Une part importante des serveurs MCP déployés sont vulnérables, manquant d'authentification et d'autorisation appropriées. Une stratégie de défense en couches, comprenant des passerelles, des couches sémantiques et des graphes de connaissances, est cruciale pour atténuer les risques. Il est conseillé aux responsables de la sécurité de mettre en œuvre des passerelles, une sécurité en couches, des audits réguliers et de limiter l'utilisation des plugins. Investir dans la sécurité spécifique à l'IA est essentiel pour faire face à ce risque émergent.
CdXz5zHNQW_WNggKLLHjV.jpeg
ReasoningBank est un nouveau cadre qui permet aux agents de modèles linguistiques volumineux (LLM) d'apprendre et de s'améliorer en organisant les expériences dans une banque de mémoire. Ce cadre extrait des stratégies de raisonnement généralisables à partir des tentatives réussies et infructueuses de résolution de problèmes. L'agent utilise cette mémoire lors de l'inférence, évitant les erreurs passées et prenant de meilleures décisions sur de nouvelles tâches. ReasoningBank surpasse les mécanismes de mémoire traditionnels sur les benchmarks de navigation web et d'ingénierie logicielle. Les agents LLM actuels échouent souvent à apprendre des expériences accumulées, répétant les erreurs et manquant des informations précieuses. ReasoningBank y remédie en transformant chaque expérience de tâche en une mémoire de raisonnement réutilisable. Cela permet aux agents d'adapter des stratégies éprouvées à partir de cas similaires passés. Le cadre utilise un schéma LLM-as-a-judge pour juger du succès et de l'échec, éliminant ainsi le besoin d'étiquetage humain. Les agents récupèrent les mémoires pertinentes pour guider les actions en intégrant la mémoire dans leur processus de raisonnement. Memory-aware Test-Time Scaling (MaTTS) améliore les performances en intégrant la mise à l'échelle avec ReasoningBank. MaTTS intègre une mise à l'échelle parallèle et séquentielle, améliorant encore les performances. ReasoningBank a montré des taux de réussite améliorés et une réduction des étapes d'interaction dans les tâches de navigation web. Il a un impact direct sur les coûts opérationnels, en particulier en éliminant les essais et erreurs. ReasoningBank offre une voie pratique vers la construction d'agents adaptatifs et d'apprentissage tout au long de la vie pour les entreprises et les applications.
CdXz5zHNQW_AsGWTGL8tp.jpeg
Notion a reconstruit son logiciel de productivité à partir de zéro pour la version 3.0 afin de prendre en charge l'IA agentique à l'échelle de l'entreprise. Ce changement a dépassé les flux de travail d'IA traditionnels, étape par étape, pour des modèles de raisonnement avancés capables de planification autonome et d'exécution d'outils. La nouvelle architecture permet aux agents d'IA de sélectionner, d'orchestrer et d'exécuter des outils de manière indépendante dans des environnements connectés. Cela contraste avec les anciennes méthodes qui nécessitaient des invites exhaustives pour des tâches spécifiques. L'approche de Notion exploite des sous-agents modulaires qui recherchent, interrogent des bases de données et modifient le contenu de manière contextuelle. L'entreprise privilégie une philosophie "meilleur, plus rapide, moins cher", équilibrant latence et précision grâce à des cadres d'évaluation rigoureux. Cela inclut l'identification et l'isolement des hallucinations en bifurquant les processus d'évaluation. Notion comprend également que la latence est subjective et dépend du besoin de l'utilisateur de réponses immédiates par rapport à une analyse exhaustive. L'entreprise utilise intensivement son propre produit, générant des retours précieux et garantissant que les modèles ne régressent pas. Notion conseille aux autres entreprises de reconstruire lorsque les capacités fondamentales changent, de traiter la latence de manière contextuelle et d'ancrer les sorties dans des données fiables. Ils croient en la prise de décisions difficiles et en restant à la pointe du développement de l'IA pour créer des expériences client optimales.
CdXz5zHNQW_VmuSSuHQ41.png
Le PDG d'OpenAI, Sam Altman, et Sir Jony Ive, le designer légendaire derrière les produits les plus emblématiques d'Apple, ont eu une conversation à Fort Mason pour discuter de leur collaboration sur la création d'une nouvelle famille d'appareils alimentés par l'IA. Le partenariat a été consolidé par l'acquisition par OpenAI de la startup matérielle d'Ive, Io, et la discussion s'est concentrée sur la philosophie et l'ambition derrière leur collaboration secrète. Ive a articulé une vision pour réparer notre relation brisée avec la technologie, ce qu'il considère comme une mission profonde et thérapeutique. La collaboration a mis des années à se concrétiser, mais le lancement de ChatGPT a fourni un but soudain et clair pour le collectif de design post-Apple d'Ive, LoveFrom. Ive a décrit l'état actuel de la technologie comme profondément imparfait et croit que l'IA peut être la solution à ce problème, plutôt qu'une extension de celui-ci. L'objectif principal des nouveaux appareils est le bien-être émotionnel, plutôt que la productivité, et Ive veut que les outils rendent les gens heureux, épanouis et moins anxieux. Le projet implique une famille d'appareils qui s'écarteront probablement du monde centré sur l'écran que nous habitons, avec des rapports suggérant un appareil de la taille d'une paume sans écran qui s'appuie sur des caméras et des microphones pour percevoir son environnement. Ive a soutenu qu'il serait absurde de supposer que la technologie d'IA d'aujourd'hui devrait être livrée via des produits vieux de plusieurs décennies, et l'objectif est de créer quelque chose de totalement nouveau mais complètement naturel. La conversation s'est conclue sans révélation de produit, laissant au public un plan philosophique plutôt que technique, et Ive mise sur un avenir sans écran alimenté par l'intelligence d'OpenAI pour rendre les gens moins anxieux et plus humains. Le récit central est clair, avec Ive, le designer qui a mis un écran dans chaque poche, travaillant désormais vers un avenir où la technologie est plus intuitive et moins intrusive.
CdXz5zHNQW_pHpSd3oyj5.webp
CdXz5zHNQW_Gh4GwJzeNS.png
AI21 Labs présente Jamba Reasoning 3B, un modèle open-source "minuscule" conçu pour une utilisation en entreprise sur des appareils tels que les ordinateurs portables et les téléphones. Ce modèle peut gérer un raisonnement étendu, la génération de code et des réponses basées sur la vérité fondamentale, traitant plus de 250 000 tokens. AI21 considère les petits modèles comme cruciaux pour les entreprises, réduisant la charge des centres de données en déplaçant l'inférence vers les appareils, ce qui permet de faire face aux coûts élevés des centres de données. Jamba Reasoning 3B combine Mamba et Transformers, permettant une grande fenêtre contextuelle et des vitesses d'inférence plus rapides, testées à 35 tokens par seconde sur un MacBook Pro. L'architecture hybride minimise également les besoins en mémoire, améliorant l'efficacité informatique. Le modèle excelle dans des tâches telles que l'appel de fonctions et la génération basée sur des politiques, ce qui le rend adapté aux requêtes plus simples. Les performances de Jamba Reasoning 3B surpassent celles d'autres petits modèles dans des benchmarks tels que IFBench et Humanity's Last Exam. Comparé à d'autres modèles, tels que Qwen 4B et Llama 3.2B-3B, Jamba Reasoning 3B offre une meilleure orientabilité et une confidentialité accrue pour les entreprises, car l'inférence reste locale. Les entreprises adoptent de plus en plus de petits modèles, avec des concurrents comme Meta, Google et FICO qui publient également leurs propres modèles ciblés. Le co-PDG d'AI21 estime que l'optimisation de l'expérience client grâce à des modèles sur appareil deviendra une tendance dominante.
CdXz5zHNQW_IwOE2OHdnt.png
Le PDG d'OpenAI, Sam Altman, a révélé lors de la DevDay une vision visant à transformer le monde numérique au-delà des simples chatbots. L'entreprise évolue vers une plateforme informatique complète, passant de la fourniture de modèles à la construction d'un écosystème entier. ChatGPT est réinventé en tant que plateforme avec un SDK d'applications, permettant aux développeurs de créer et de distribuer des applications directement dans l'interface de chat. Ces applications peuvent offrir des expériences interactives et personnalisées, atteignant la vaste base d'utilisateurs d'OpenAI. Au-delà de ChatGPT, OpenAI équipe les agents IA avec Agent Kit, permettant à des travailleurs IA autonomes d'automatiser des tâches complexes et des processus métier. L'entreprise améliore également considérablement son agent de codage IA, Codex, alimenté par GPT-5, qui peut désormais écrire, réviser et intégrer du code de manière autonome. Une collaboration importante et non annoncée avec le légendaire designer Jony Ive a été révélée, axée sur le développement de nouveau matériel centré sur l'IA. Ive estime que les produits actuels sont inadéquats pour l'IA avancée et vise à réinitialiser la relation de l'humanité avec la technologie. Une contrainte critique pour cet avenir ambitieux est la demande massive de puissance de calcul, ce qui motive les investissements substantiels d'OpenAI dans l'infrastructure. L'entreprise considère l'IA comme le futur moteur fondamental de la croissance économique. OpenAI ne se contente pas de créer de l'IA ; elle construit l'environnement futur de l'IA, englobant des applications intelligentes, des agents et du matériel.
CdXz5zHNQW_mgL0SyLweX.webp
DeepMind de Google a publié Gemini 2.5 Pro Computer Use, un modèle d'IA conçu pour agir comme un agent virtuel sur le Web. Ce nouveau modèle peut naviguer sur les sites Web, remplir des formulaires et effectuer des actions au nom des utilisateurs, à l'instar des offres d'OpenAI et d'Anthropic. Le PDG de Google, Sundar Pichai, a souligné son importance dans le développement d'agents d'IA à usage général. Bien qu'il ne soit pas directement disponible pour les consommateurs, il est accessible via la plateforme Browserbase et l'API Gemini pour les développeurs. Le modèle s'appuie sur les capacités de Gemini 2.5 Pro, en se concentrant sur l'interaction avec les interfaces utilisateur. Il permet aux systèmes d'IA de fonctionner visuellement et fonctionnellement, contrairement aux modèles dépendants des API. Les premiers tests montrent un succès dans la navigation sur les sites Web et l'accomplissement des tâches, bien qu'il manque d'accès direct au système de fichiers de ses concurrents. Google affirme que Gemini 2.5 Computer Use est en tête des benchmarks de contrôle d'interface et offre une latence plus faible. Le modèle fonctionne dans une boucle d'interaction, analysant les captures d'écran et les invites de l'utilisateur pour recommander des actions. Les mesures de sécurité comprennent une inspection à chaque étape et des instructions définies par le développeur. Il prend en charge diverses actions d'interface utilisateur telles que le clic et la saisie, avec des coordonnées d'écran normalisées. La tarification est similaire à celle de Gemini 2.5 Pro, mais Computer Use est exclusivement une offre payante. Les données provenant de l'utilisation du niveau payant n'améliorent pas les produits Google, contrairement au niveau gratuit de Gemini 2.5 Pro.
CdXz5zHNQW_IjVm0ltTV5.png
L'IA conversationnelle promet depuis longtemps des assistants semblables à des humains, mais l'achèvement fiable des tâches en dehors du chat reste un défi important, même les meilleurs modèles échouant fréquemment dans les benchmarks. Augmented Intelligence (AUI) Inc., basée à New York, pense que son nouveau modèle de fondation, Apollo-1, offre une solution grâce au raisonnement neuro-symbolique avec état. Cette architecture hybride vise à garantir des résultats cohérents et conformes aux politiques, contrairement aux LLM purement génératifs qui produisent des résultats probables mais pas certains. Alors que les LLM excellent dans le dialogue ouvert, Apollo-1 est conçu pour les conversations orientées vers les tâches nécessitant certitude et comportement prévisible. L'approche d'AUI implique une boucle de raisonnement fermée qui traduit le langage naturel en un état symbolique, le maintenant et agissant sur celui-ci pour accomplir les tâches de manière déterministe. Apollo-1 est conçu comme un modèle de fondation agnostique au domaine, configurable via un "contrat comportemental" System Prompt. Développé sur huit ans, le modèle sépare les connaissances procédurales et descriptives des conversations orientées vers les tâches. Les benchmarks montrent qu'Apollo-1 surpasse significativement les LLM existants en termes de taux d'achèvement des tâches dans divers domaines. AUI positionne Apollo-1 comme un complément aux LLM, complétant le spectre de l'IA conversationnelle. Le modèle est actuellement en pilotes limités avec des entreprises du Fortune 500 et prévoit une sortie générale en novembre 2025 avec des capacités étendues et un accès API. La promesse principale d'Apollo-1 est de créer une IA à laquelle les entreprises peuvent faire confiance pour agir de manière fiable, comblant potentiellement le fossé entre parler et faire.
CdXz5zHNQW_nt2X1vTCyy.png
Les entreprises sont confrontées à des défis dans l'adoption complète de l'IA agentique, et IBM estime que la gouvernance des agents IA en production constitue un obstacle majeur. Lors de sa conférence TechXchange 2025, IBM a présenté de nouvelles capacités pour résoudre ces problèmes. Le projet Bob, un IDE axé sur l'IA, vise à automatiser la modernisation des applications en orchestrant plusieurs LLM. AgentOps assure la gouvernance en temps réel des agents IA dans les environnements de production. IBM a également intégré Langflow, un outil open-source, à watsonx Orchestrate, sa plateforme de déploiement d'agents IA. Cette stratégie cible la modernisation du code hérité, la gouvernance des agents IA et le rapprochement entre les prototypes d'IA et la production. Le projet Bob a permis des gains de productivité significatifs et une augmentation des commits de code en interne pour les développeurs IBM. Contrairement aux outils de codage généraux, le projet Bob se concentre sur la modernisation des entreprises, le maintien du contexte du référentiel et l'automatisation des mises à niveau complexes. Il achemine intelligemment les tâches vers le meilleur LLM en fonction de la précision, de la latence et du coût. L'outil intègre les pratiques DevSecOps, améliorant la sécurité et la conformité directement dans l'IDE. Un nouveau partenariat avec Anthropic intègre les modèles Claude à watsonx et propose un guide pour le déploiement sécurisé d'agents IA d'entreprise. L'intégration de Langflow à watsonx Orchestrate vise à transformer les prototypes open-source en systèmes de niveau entreprise avec une gouvernance et une évolutivité accrues. AgentOps et Agentic Workflows améliorent encore watsonx Orchestrate en fournissant une coordination standardisée des agents et une gouvernance de production. Les annonces d'IBM soulignent que l'infrastructure de gouvernance est désormais essentielle pour un déploiement sûr et évolutif des agents IA dans les entreprises.
CdXz5zHNQW_5QG6tSIjHf.png
OpenAI a lancé AgentKit, une nouvelle plateforme conçue pour simplifier la création d'agents pour les entreprises. L'objectif est de centraliser les efforts de développement, auparavant fragmentés entre divers outils. AgentKit introduit Agent Builder, une toile visuelle pour la conception et la gestion des versions des flux de travail multi-agents. Il comprend également un Connector Registry pour gérer les connexions aux produits OpenAI et aux services tiers. ChatKit permet une intégration facile des interfaces de chat pour ces agents. OpenAI étend également les capacités d'évaluation des agents avec une notation automatisée et une optimisation des invites. Bien que certaines fonctionnalités soient en version bêta, ChatKit et les nouveaux outils d'évaluation sont généralement disponibles. La tarification d'AgentKit sera intégrée aux modèles d'API OpenAI existants, attirant ainsi davantage d'entreprises dans l'écosystème d'OpenAI. La plateforme promet une itération rapide et une visibilité sur les fonctionnalités des agents, comme en témoigne un agent d'analyse d'agenda rapide. Des concurrents tels que Google et Microsoft proposent également des kits d'outils de développement similaires pour la création d'agents. Les premiers utilisateurs, comme la société fintech Ramp, signalent des gains de temps considérables et une collaboration améliorée. Le Connector Registry proposera des intégrations pré-construites avec des plateformes populaires telles que Dropbox et Google Drive. Une fonctionnalité de sécurité appelée Guardrails est incluse pour prévenir les fuites de données personnelles identifiables (PII) et les comportements malveillants. ChatKit vise à simplifier le processus complexe de déploiement d'interfaces de chat pour les agents. Bien qu'AgentKit simplifie la création, il n'élimine pas le besoin d'expertise technique, et certains le considèrent comme un complément à des plateformes comme Zapier.
CdXz5zHNQW_XZ1pBu5IjW.png
La conférence DevDay d'OpenAI a présenté un SDK d'applications innovant, permettant aux développeurs tiers de créer des applications directement dans ChatGPT, y compris des options payantes. Cette nouvelle fonctionnalité permet aux utilisateurs d'interagir de manière transparente avec des applications externes et leurs données sans quitter l'interface du chatbot. Les utilisateurs peuvent demander à des applications comme Canva de créer des présentations ou à Zillow de trouver des maisons, le tout par le biais de requêtes conversationnelles. Le SDK d'applications est basé sur le standard open-source Model Context Protocol précédemment introduit par Anthropic. Il permet aux modèles ChatGPT d'accéder au contexte en temps réel de ces applications intégrées. Les développeurs peuvent créer des applications qui s'affichent sous forme de cartes, de carrousels, ou en mode plein écran et en incrustation, préservant ainsi le flux conversationnel de ChatGPT. Les premières intégrations présentées avec Coursera, Canva et Zillow démontrent le potentiel d'apprentissage interactif, de conception et de navigation immobilière. D'autres partenaires comme Booking.com, Expedia et Spotify intègrent également leurs services. Pour garantir la sécurité et la confidentialité, toutes les applications doivent respecter des directives strictes, y compris des politiques de confidentialité claires et le consentement de l'utilisateur. OpenAI transforme ChatGPT en un système d'exploitation d'IA complet en favorisant cet écosystème d'applications. Cette démarche crée de nouvelles opportunités pour les développeurs et offre aux utilisateurs une interface conversationnelle unifiée pour diverses tâches. Cependant, des questions subsistent concernant la confidentialité des données et l'avenir du GPT Store d'OpenAI.
CdXz5zHNQW_0txH2exhFQ.png
La migration cognitive actuelle, pilotée par l'IA, présente des perspectives radicalement différentes pour le Nord et le Sud mondiaux. Alors que les économies occidentales, en particulier celles de la Silicon Valley, envisagent l'avancée de l'IA avec appréhension quant au déplacement d'emplois pour les cols blancs, le Sud mondial y voit une opportunité de développement transformatrice. Les données montrent un écart de confort significatif, une majorité de pays comme l'Inde, l'Indonésie et le Nigeria adoptant l'IA, contre moins d'un tiers aux États-Unis. Pour le Sud mondial, l'IA promet des avancées dans l'éducation, la santé et l'agriculture, leur permettant de sauter les révolutions industrielles précédentes. Cependant, ce récit optimiste est tempéré par des obstacles importants tels que les déficits d'infrastructure, la rareté des données et le manque de professionnels qualifiés. Malgré ces défis, la perception de l'IA comme un outil de développement, plutôt qu'une menace pour les professions établies, alimente une plus grande confiance dans ces régions. Les récits médiatiques amplifient encore cette divergence, les médias occidentaux se concentrant sur l'anxiété liée à l'automatisation et les médias du Sud mettant en évidence le potentiel de progrès de l'IA. Sous la surface de ces différences perçues, la migration de l'IA entraîne des coûts cachés. Le travail essentiel mais souvent mal rémunéré, comme l'annotation de données, soutient l'économie mondiale de l'IA, tandis que des secteurs comme l'externalisation des processus d'affaires sont menacés par l'automatisation. Cela soulève la question de savoir si l'IA crée une migration unique et unifiée ou plusieurs parcours distincts. En fin de compte, la migration de l'IA est un phénomène complexe et enchevêtré, pas un événement singulier. Bien que les expériences du Nord et du Sud mondiaux diffèrent, tous deux gagnent et perdent des aspects de leurs structures existantes. Le voyage est inégal, avec des points de départ, des itinéraires et des fardeaux variables. Le Sud mondial, malgré les défis structurels auxquels il est confronté, considère souvent l'IA comme un levier de progrès, offrant des modèles d'inclusion et de confiance. La conclusion essentielle est que l'adaptation nécessite de l'imagination et une reconnaissance des gains et des pertes. Ignorer les signaux de progrès et d'extraction inégaux risque de créer un avenir où les avantages de l'IA seront concentrés entre quelques élus. Par conséquent, la conception du développement de l'IA avec l'inclusion et la confiance en son cœur, en tirant des leçons d'expériences mondiales diverses, est essentielle pour un avenir humain partagé.
CdXz5zHNQW_Qn7nCgO4sX.jpeg
Les menaces de cybersécurité ont considérablement augmenté en volume et en sophistication en raison de l'IA, submergeant les centres d'opérations de sécurité traditionnels. L'ancien modèle de ticket et d'enquête n'est plus efficace, nécessitant plus d'analystes que de nombreuses organisations ne peuvent en supporter. Pour remédier à cela, DXC Technology, en partenariat avec 7AI, a lancé le DXC Agentic Security Operations Center. Ce nouveau SOC intègre des agents IA autonomes pour gérer le triage des menaces, l'enquête et la réponse à grande échelle. Les tests effectués sur le propre SOC de DXC ont révélé des améliorations significatives, notamment une réduction de 80 % du temps des analystes de niveau 1 et une diminution de 67 % du temps moyen de réponse. Cela représente un changement fondamental, passant des réponses automatisées à une sécurité agentique adaptative, contextuelle et de bout en bout. Les agents IA évaluent de manière unique chaque alerte, apprenant et s'adaptant des incidents passés. Le SOC agentique de DXC élimine les goulots d'étranglement du traitement manuel, s'attendant à économiser un temps d'enquête considérable par incident. Bien que les organisations puissent être confrontées à des obstacles émotionnels et opérationnels dans l'adoption de l'IA, celle-ci est présentée comme une évolution essentielle pour survivre en cybersécurité. Une mise en œuvre réussie nécessite un parrainage de haut niveau et peut être considérée comme une simple augmentation des capacités des analystes humains.
CdXz5zHNQW_mHOXYQCS5M.png
Le discours actuel sur l'automatisation par l'IA surestime souvent ses capacités. Bien que les outils d'IA soient présentés comme une solution miracle pour remplacer les travailleurs humains, en particulier dans le domaine de la technologie, ce battage médiatique ne correspond pas aux réalités actuelles. Le remplacement des humains par l'IA dans la plupart des emplois reste une idée pour l'avenir, et non une possibilité immédiate. Les modèles d'IA sont entraînés sur des données existantes, et le code propriétaire sophistiqué des entreprises est largement inaccessible pour l'entraînement. Par conséquent, l'IA excelle actuellement dans les tâches simples et répétitives, mais peine avec le code d'infrastructure complexe et unique. L'IA fonctionne aujourd'hui comme un membre junior d'une équipe, nécessitant une supervision et une révision humaines importantes pour les projets plus complexes. En programmation, par exemple, la correction du code généré par l'IA peut prendre plus de temps que de l'écrire à partir de zéro. Les professionnels expérimentés sont essentiels pour identifier les défauts et comprendre les risques à long terme dans le travail généré par l'IA. Le véritable objectif de l'IA dans les affaires devrait être d'augmenter les capacités humaines, et non de remplacer des équipes entières. Les dirigeants d'entreprise devraient reconnaître que le recours excessif à l'IA pour des tâches complexes peut entraîner des conséquences négatives imprévues. En fin de compte, l'accent devrait être mis sur le renforcement des travailleurs humains grâce à l'IA, plutôt que sur la recherche de leur élimination.
CdXz5zHNQW_XoQRRo1jkl.png
Le modèle traditionnel de Von Neumann ou de Harvard a été à la base de presque toutes les puces modernes, y compris les CPU, les GPU et les accélérateurs spécialisés, depuis plus d’un demi-siècle. Cependant, une nouvelle approche appelée exécution déterministe remet en question ce statu quo en planifiant chaque opération avec une précision au niveau du cycle, créant ainsi un calendrier d’exécution prévisible. Cette approche permet à un seul processeur d’unifier le calcul scalaire, vectoriel et matriciel, en gérant à la fois les charges de travail à usage général et les charges de travail intensives en IA sans dépendre d’accélérateurs distincts. L’exécution déterministe élimine entièrement la spéculation, chaque instruction ayant un créneau horaire et une allocation de ressources fixes, ce qui garantit qu’elle est émise exactement au bon cycle. Le mécanisme sous-jacent est une matrice temps-ressources, un cadre de planification qui orchestre les ressources de calcul, de mémoire et de contrôle au fil du temps. Cette approche répond aux défis des charges de travail d’IA d’entreprise, qui poussent les architectures existantes à leurs limites, en fournissant une architecture unifiée et des performances prévisibles. L’exécution déterministe réduit également la consommation d’énergie et l’encombrement physique en simplifiant la logique de contrôle, ce qui se traduit par une surface de puce plus petite et une consommation d’énergie réduite. Les principales innovations de l’architecture comprennent la matrice temps-ressources, les registres fantômes, les tampons de données vectorielles et les tampons de relecture d’instructions, qui permettent un moteur de calcul qui combine la flexibilité d’un processeur avec le débit soutenu d’un accélérateur. L’exécution déterministe a de vastes implications pour d’autres domaines, notamment les systèmes critiques pour la sécurité, les systèmes d’analyse en temps réel et les plates-formes d’edge computing, où elle peut fournir des garanties de synchronisation déterministes, simplifier la vérification et améliorer l’efficacité énergétique. Le passage à l’exécution déterministe représente un retour à la simplicité architecturale, où une puce peut remplir plusieurs rôles sans compromis, et a le potentiel de réduire la complexité matérielle, de réduire les coûts d’énergie et de simplifier le déploiement de logiciels.
CdXz5zHNQW_rOnVCPJlCA.png
OpenAI organise sa troisième conférence annuelle DevDay pour maintenir son avantage concurrentiel dans le paysage de l'IA en évolution rapide. L'événement est crucial alors que des rivaux comme Google, Anthropic et Meta font progresser agressivement leurs capacités en matière d'IA. Le PDG Sam Altman prononcera le discours d'ouverture, promettant des annonces importantes et une vision de l'avenir de l'IA. La conférence souligne le passage d'OpenAI aux clients d'entreprise pour générer des revenus, avec des sessions axées sur l'adoption de l'IA à grande échelle et les flux de travail internes. L'ordre du jour de cette année met l'accent sur le rôle crucial de la communauté des développeurs dans le positionnement stratégique d'OpenAI. L'événement présentera l'IA de nouvelle génération à travers des fonctionnalités telles que Sora Cinema et des démonstrations interactives, y compris un "portrait vivant" d'Alan Turing. OpenAI aborde également les préoccupations en matière de sécurité de l'IA, retardant la publication d'un modèle à poids ouverts pour des tests supplémentaires. La présence de Jony Ive suggère des ambitions potentielles en matière de matériel grand public pour l'entreprise. L'intensification de la concurrence oblige OpenAI à se concentrer sur les prix, l'expérience développeur et les capacités spécialisées. En fin de compte, DevDay déterminera si OpenAI peut maintenir son leadership face à une pression de marché sans précédent.
CdXz5zHNQW_3jaZcPehTf.webp
Une nouvelle étude présente LIMI, un cadre démontrant que moins de données peuvent conduire à des agents d'IA plus intelligents. Les chercheurs ont découvert que des démonstrations agentiques de haute qualité, et non des ensembles de données massifs, sont la clé du développement de systèmes d'IA autonomes. L'approche de LIMI se concentre sur la curation d'exemples stratégiquement choisis de résolution de problèmes par l'IA. Les expériences ont montré qu'un modèle entraîné sur seulement 78 démonstrations soigneusement sélectionnées a surpassé de manière significative les modèles entraînés sur des milliers d'exemples. Cette découverte est cruciale pour les applications d'entreprise où la collecte de données est difficile et coûteuse. L'agentivité est définie comme des systèmes d'IA capables de découvrir de manière autonome des problèmes, de formuler des hypothèses et d'exécuter des solutions. L'entraînement actuel des LLM suppose souvent que plus de données équivaut à une intelligence agentique plus élevée, ce qui entraîne des pipelines complexes et des exigences en ressources. La méthode de LIMI implique la collecte de requêtes et de trajectoires détaillées des actions de l'IA pour les résoudre. L'ensemble de données a été construit à l'aide de scénarios réels et de requêtes synthétisées, validées par des experts humains. Les trajectoires ont capturé l'ensemble du processus de résolution de problèmes, y compris les erreurs et les améliorations. Les modèles entraînés par LIMI ont obtenu des scores supérieurs sur les benchmarks pour les compétences agentiques, l'utilisation d'outils et le codage. L'étude suggère que la maîtrise de l'agentivité concerne la compréhension de ses principes fondamentaux, et non pas seulement la mise à l'échelle des données. Ce cadre offre une voie durable pour le développement d'agents d'IA spécialisés pour les entreprises.
CdXz5zHNQW_yoQp2prh7q.jpeg
Google vise à intégrer profondément son assistant de codage, Jules, dans les flux de travail des développeurs, au-delà des simples interfaces de chat. Deux nouvelles fonctionnalités, une API Jules et une CLI Jules Tools, sont conçues pour réaliser cette intégration. L'API permettra à Jules de se connecter aux IDE, tandis que la CLI permettra une utilisation directe dans la ligne de commande. Cette démarche s'inscrit dans une tendance industrielle plus large d'intégration d'agents IA dans les applications pour une plus grande commodité utilisateur. Les développeurs peuvent désormais accéder à Jules directement depuis leurs terminaux, facilitant des tâches telles que les tests, la compilation et le débogage sans quitter leur flux de travail. La CLI offre une installation via npm, avec des commandes pour interroger Jules et personnaliser son comportement. L'API offre aux entreprises une plus grande flexibilité, permettant l'intégration avec des plateformes comme Slack pour déclencher des tâches directement à partir de messages. Cette intégration permet aux membres de l'équipe d'initier des actions, telles que des corrections de bugs, directement depuis Slack, qui interagit ensuite avec leurs pipelines CI/CD. Google a également mis en œuvre des mises à jour pour réduire la latence et résoudre les problèmes environnementaux. Ces mises à jour comprennent un sélecteur de fichiers pour ajouter du contexte dans le chat et une fonctionnalité de mémoire pour se souvenir des préférences de l'utilisateur. La gestion des variables d'environnement a également été améliorée, accordant à Jules l'accès pendant l'exécution des tâches. Dans l'ensemble, la réponse à ces mises à jour a été largement positive, bien qu'une certaine confusion subsiste concernant les multiples offres de CLI d'agents de codage de Google.
CdXz5zHNQW_rFAJmlGeLU.png
CdXz5zHNQW_Q97ejJIKBP.webp
IBM a lancé Granite 4.0, une nouvelle famille de grands modèles de langage open-source conçus pour des performances et une efficacité élevées. Cette sortie marque le retour d'IBM sur le marché concurrentiel des LLM, en particulier face aux modèles chinois comme Qwen d'Alibaba. Granite 4.0 utilise une nouvelle architecture hybride combinant les conceptions Transformer et Mamba. Les Transformers excellent dans la gestion du contexte mais sont coûteux en calcul, tandis que Mamba est plus efficace pour les longues séquences. Cette approche hybride vise à tirer parti des forces des deux, réduisant considérablement la consommation de mémoire GPU de plus de 70 %. Les modèles sont disponibles sous une licence permissive Apache 2.0, encourageant l'utilisation commerciale et les modifications. Granite 4.0 démontre de solides performances sur les benchmarks pour le suivi d'instructions et l'appel de fonctions. IBM met l'accent sur la confiance et la sécurité, Granite étant la première famille de modèles ouverts certifiée selon la norme ISO/IEC 42001. Les modèles sont entraînés sur un vaste corpus de 22 billions de tokens, incluant des ensembles de données pertinents pour les entreprises. IBM prévoit une expansion supplémentaire avec des modèles additionnels pour divers besoins d'entreprise. Les modèles Granite 4.0 sont accessibles via des plateformes comme Hugging Face et IBM watsonx.ai, avec un soutien élargi des partenaires attendu. Cette sortie positionne IBM comme un fournisseur de solutions d'IA prêtes pour l'entreprise, rentables et sécurisées.
CdXz5zHNQW_HqCqdCGH6N.png
La conférence INBOUND de HubSpot à San Francisco s'est concentrée sur l'innovation en matière de marketing, de ventes, d'expérience client (CX) et d'IA. Le directeur de la technologie de HubSpot, Dharmesh Shah, a discuté de la double nature de l'IA en tant qu'opportunité exponentielle et menace existentielle. Il a souligné l'importance de collaborer avec l'IA plutôt que de rivaliser avec elle, la considérant comme un outil doté d'immenses capacités prédictives. Shah a souligné que la courbe d'apprentissage de l'IA est linéaire par rapport à sa croissance exponentielle de capacités. Il a comparé l'IA générative à avoir des milliers de docteurs en poche, permettant des tâches créatives et ambitieuses. Cependant, il a noté les limites de l'IA, telles que sa dépendance aux données d'entraînement et les hallucinations occasionnelles. Shah a donné un conseil pratique : essayer l'IA pour chaque tâche informatique, considérant les échecs comme des revers temporaires. Il a souligné l'importance de l'ingénierie des prompts, y compris la qualité du prompt, le choix du modèle et le contexte. Au-delà des prompts, l'ingénierie du contexte avec des instructions personnalisées améliore considérablement les résultats de l'IA. Shah a déclaré que c'est la décennie des agents IA, pas seulement l'année, avec des millions de personnes utilisant déjà des plateformes comme Agent.ai. Il a proposé la stratégie TEAM pour intégrer l'IA aux équipes : trier, expérimenter, automatiser et mesurer. En fin de compte, les humains gagnent grâce au quotient émotionnel, en fusionnant l'expérience vécue avec l'IA pour une intelligence augmentée. L'IA est destinée à gérer les tâches répétitives, permettant aux humains de se concentrer sur un travail plus remarquable et plus agréable.
CdXz5zHNQW_epiXUZ71ro.png
Les accords d'entreprise pour les outils de codage IA ne sont pas remportés par la vitesse, mais par la sécurité, la conformité et le contrôle du déploiement. Cette déconnexion entre la préférence des développeurs pour la vitesse et les exigences des acheteurs remodèle le marché, entraînant une adoption plus lente des outils les plus rapides. Les exigences de conformité excluent systématiquement de nombreux outils de codage IA rapides de la considération des entreprises. GitHub Copilot mène l'adoption en entreprise en raison de son intégration dans l'écosystème, tandis que Claude Code d'Anthropic est populaire pour sa flexibilité de déploiement et ses fonctionnalités de sécurité. Ce compromis oblige les entreprises à adopter des stratégies coûteuses multiplateformes, près de la moitié utilisant plus d'un outil de codage IA. Les grandes entreprises privilégient la sécurité comme principal obstacle à l'adoption, tandis que les petites équipes remettent en question le retour sur investissement. Des tests pratiques simulant les besoins des entreprises ont révélé que l'approche méthodique de Claude Code, bien que plus lente, a évité des erreurs d'implémentation coûteuses. Seul Claude Code a mis en garde contre le partage de secrets, une considération de conformité cruciale pour les industries réglementées. Les plateformes exclusivement cloud sont également exclues par les organisations qui exigent des options de déploiement isolées. Le coût total de possession réel des outils de codage IA dépasse considérablement les prix publiés, nécessitant souvent des stratégies à double plateforme qui doublent les dépenses. Malgré ces coûts, les implémentations réussies démontrent des économies significatives pour les développeurs et une amélioration de la vitesse de livraison des fonctionnalités, justifiant l'investissement.
Les entreprises utilisent souvent des pipelines ETL coûteux pour déplacer les données opérationnelles PostgreSQL à des fins d'analyse ou d'IA, ce qui entraîne des retards et nécessite des équipes d'ingénierie dédiées. Cette approche traditionnelle est insuffisante pour le rythme rapide du développement d'applications pilotées par des agents IA. Databricks fait l'acquisition de Mooncake pour éliminer les pipelines ETL en rendant les données opérationnelles instantanément disponibles pour l'analyse et l'IA. La technologie de Mooncake permet aux charges de travail analytiques de s'exécuter directement sur PostgreSQL et fournit une transformation en temps réel vers des formats colonnaires sans ETL traditionnel. Cette intégration devrait améliorer les performances de déplacement des données de 10x à 100x. L'urgence de cette acquisition est soulignée par le nombre croissant de bases de données créées par les agents IA. L'approche de Mooncake simplifie l'accès aux données pour les agents, permettant une itération plus rapide. La stratégie de Databricks la positionne face aux offres PostgreSQL gérées des fournisseurs de cloud tels qu'AlloyDB de Google et Aurora d'Amazon, en mettant l'accent sur les modèles opérationnels et analytiques intégrés. Cette acquisition vise à libérer des ressources d'ingénierie en simplifiant la gestion de l'infrastructure de données et en permettant un déploiement plus rapide d'applications pilotées par l'IA. En fin de compte, cela permet aux équipes de développement d'accéder aux données opérationnelles pour l'analyse et l'IA sans les goulots d'étranglement de l'ingénierie des données.
CdXz5zHNQW_tNN5kVF2B8.jpeg
Slack introduit de nouvelles capacités de plateforme pour permettre aux agents d'IA d'accéder directement à ses vastes données conversationnelles dans les canaux de travail. Cette démarche vise à rendre les agents d'IA plus pertinents et utiles en les ancrant dans les discussions, les décisions et les connaissances institutionnelles en temps réel. L'approche de Slack la positionne comme une couche fondamentale pour l'IA plutôt que de construire des fonctionnalités isolées. L'API de recherche en temps réel et le serveur Model Context Protocol permettent un accès sécurisé et conscient des permissions aux messages et fichiers de Slack. Cela résout un problème majeur dans le développement des agents d'IA : leur intégration dans le flux de travail réel. Des entreprises leaders en IA comme Anthropic et Google s'appuient déjà sur ces nouvelles capacités de Slack. L'architecture de sécurité de Slack garantit que les agents d'IA n'accèdent qu'aux informations autorisées, en utilisant les identifiants authentifiés des utilisateurs. L'entreprise a également interdit contractuellement l'utilisation des réponses de l'API pour former des modèles d'IA tiers. Cette stratégie est en concurrence directe avec Microsoft Teams, qui intègre également l'IA via sa plateforme Copilot. L'objectif de Slack est de devenir un hub d'intégration, stimulant l'engagement et la rétention des utilisateurs sans frais directs pour les développeurs d'IA. Cette approche vise à faire de Slack le système nerveux central du travail d'entreprise, justifiant des prix d'abonnement plus élevés. La vision est que les agents d'IA agissent comme des coéquipiers conversationnels au sein de Slack, réduisant les coûts de changement de contexte et donnant accès aux données de prise de décision informelles. Slack a construit une infrastructure pour gérer efficacement les requêtes d'IA en temps réel, garantissant des réponses rapides et ciblées. Le succès de cette stratégie dépend de l'adoption par les entreprises de l'IA conversationnelle comme une extension naturelle de la communication d'équipe.
CdXz5zHNQW_tyajYhtMZu.webp
Thinking Machines, une startup d'IA fondée par Mira Murati, ancienne directrice technique d'OpenAI, a lancé Tinker, son premier produit conçu pour simplifier le réglage fin des grands modèles linguistiques (LLM). Tinker est une API basée sur Python qui offre aux développeurs un contrôle granulaire sur les pipelines d'entraînement tout en gérant l'infrastructure de calcul distribuée. Cela permet aux chercheurs de se concentrer sur la conception expérimentale et le développement de modèles personnalisés sans les maux de tête liés à l'infrastructure. L'outil fournit des primitives natives Python, prend en charge divers modèles à poids ouverts, y compris les Mixture-of-Experts, et s'intègre au réglage basé sur LoRA pour une efficacité des coûts. Tinker comprend également une bibliothèque compagnon open-source, le Tinker Cookbook. Des chercheurs d'institutions telles que Princeton et Stanford ont déjà utilisé Tinker pour des tâches telles que la preuve formelle de théorèmes et le raisonnement chimique, obtenant des améliorations significatives des performances. La communauté de recherche en IA a salué Tinker pour son approche centrée sur le développeur, qui sépare le contrôle algorithmique de la gestion de l'infrastructure. Andrej Karpathy a souligné la conception intelligente de Tinker, permettant aux utilisateurs de conserver le contrôle algorithmique tout en déchargeant la complexité de l'infrastructure. John Schulman a décrit Tinker comme l'infrastructure qu'il a toujours souhaitée, permettant des opérations puissantes sans surveillance manuelle constante. Tinker est actuellement en version bêta privée et introduira bientôt un modèle de tarification à l'utilisation. Thinking Machines, qui a levé 2 milliards de dollars, vise à soutenir le développement d'IA ouvert et personnalisable, se distinguant par son accent sur les systèmes d'IA multimodaux qui collaborent avec les utilisateurs.
CdXz5zHNQW_MzfP74f9Mr.png