InfoQ RSS

INFOQ est une entreprise de médias axée sur la technologie qui vise à partager les informations émergentes sur la technologie et les pratiques innovantes en ingénierie logicielle, y compris l'IA, la science des données, et bien plus encore. Le site propose des articles, des vidéos et des interviews avec des leaders de l'industrie technologique.

Fil de notes

Article : Si les architectures pouvaient parler, elles citeraient votre patron

L'architecture logicielle reflète la façon dont les organisations communiquent et prennent des décisions. Les échecs proviennent d'incitations mal alignées, de propriétés peu claires et de lacunes structurelles, et non de défauts techniques. Les architectes doivent concevoir non seulement des systèmes, mais également les conditions pour que les systèmes prospèrent, en utilisant la pensée plateforme pour réduire les frictions et favoriser l'autonomie. Par Sven-Torben Janus
CdXz5zHNQW_WwONP7x5rW.jpeg

HashiCorp met en garde : les outils traditionnels de détection de secrets sont en retard.

HashiCorp a émis un avertissement selon lequel les outils traditionnels d'analyse des secrets ne parviennent pas à suivre les réalités du développement logiciel moderne. Dans un nouveau billet de blog, l'entreprise soutient que la détection post-validation et la correspondance de modèles fragiles laissent des lacunes dangereuses dans la couverture. Par Matt Foster
CdXz5zHNQW_hv1JqwZvQO.jpeg

10 sessions exceptionnels liés à l'IA à QCon San Francisco 2025

Rejoignez-nous à QCon San Francisco 2025 (17-21 nov) pour une plongée en profondeur de trois jours dans l'avenir du développement logiciel, en explorant l'impact transformateur de l'IA. En tant que membre du comité de programme, je suis ravi de présenter des pistes qui traitent de défis du monde réel, mettant en vedette des leaders de l'industrie et des sessions sur l'IA, les LLM et les mentalités d'ingénierie. Ne manquez pas ! Par Hien Luu
CdXz5zHNQW_gJ6J20DmqN.jpeg

Paper2Agent transforme les articles scientifiques en agents d'IA interactifs

Le framework Paper2Agent de Stanford révolutionne la recherche en transformant des articles statiques en agents d'IA interactifs qui exécutent des analyses et répondent aux requêtes. Tirant parti du Model Context Protocol, il simplifie la reproductibilité et améliore l'accessibilité, offrant aux utilisateurs des outils dynamiques et autonomes pour une exploration et une compréhension scientifiques plus approfondies. Par Robert Krzaczyński.
CdXz5zHNQW_qgAUPpjsys.jpeg

L'extension Genkit pour Gemini CLI apporte une assistance IA consciente du framework au terminal

Présentation de l'extension Genkit de Google pour Gemini CLI : un outil révolutionnaire qui offre une assistance IA consciente du framework directement dans le terminal. Simplifiez le développement de vos applications Genkit grâce à la génération de code contextuelle, au débogage et aux meilleures pratiques, le tout sans quitter la ligne de commande. Libérez la productivité et l'innovation dans la création d'applications d'IA générative. Par Hien Luu.
CdXz5zHNQW_vAuNeB8Q1V.jpeg

Présentation : La pensée systémique pour la mise à l'échelle d'architectures multi-agents responsables

Nimisha Asthagiri explique le besoin crucial d'une IA responsable dans les systèmes multi-agents complexes. Elle partage des techniques pratiques pour les chefs d'ingénierie et les architectes, en appliquant la pensée systémique et les diagrammes de flux causaux. Elle montre comment ces méthodes aident à prédire et à atténuer les conséquences imprévues et les risques structurels inhérents aux agents autonomes et apprenants, en utilisant l'exemple d'un agent planificateur. Par Nimisha Asthagiri
CdXz5zHNQW_BNnEbR6aIc.jpeg

Le registre GitHub MCP offre une plateforme centrale pour découvrir et déployer des serveurs MCP

GitHub a récemment lancé son registre Model Context Protocol (MCP), conçu pour aider les développeurs à découvrir et à utiliser les outils d'IA directement depuis leur environnement de travail. Le registre répertorie actuellement plus de 40 serveurs MCP de Microsoft, GitHub, Dynatrace, Terraform et bien d'autres. Par Sergio De Simone.
CdXz5zHNQW_nLkySMlmN9.jpeg

Seed4J 2.0 propose une migration depuis JHipster Lite

La sortie de Seed4J 2.0 effectue une migration de JHipster Lite 1.35.0. Seed4J est un « générateur de code modulaire qui aide les développeurs à démarrer leurs applications avec clarté, structure et objectif ». Pascal Grimaud, créateur de Seed4J et ancien co-leader de JHipster, s'est entretenu avec InfoQ à propos de cette migration. Par Michael Redlich.
CdXz5zHNQW_Kgi2OrJ5KM.jpeg

Article : Go Channels : Comprendre Happens-Before pour une Concurrence Sûre

Cet article explore la sémantique "happens-before" des canaux Go, expliquant comment elle se rapporte à la visibilité de la mémoire, à la synchronisation et à la correction de la concurrence. Nous examinerons les pièges subtils, les illustrerons avec des exemples et explorerons les implications architecturales pour les concepteurs de systèmes. Par Gabor Koos.
CdXz5zHNQW_j7goVRqMWg.jpeg

Balado : Les modèles mentaux en architecture et les vues sociétales de la technologie : une conversation avec Nimisha Asthagiri

Dans ce podcast, Michael Stiefel a discuté avec Nimisha Asthagiri de l'importance de la pensée systémique, des systèmes multi-agents, des conséquences de l'application par la société d'une technologie dans un domaine pour lequel elle n'a pas été conçue, et de savoir si nous pouvons jamais avoir une relation saine avec l'intelligence artificielle. Par Nimisha Asthagiri
CdXz5zHNQW_vxHoN2fzKS.jpeg

OpenAI ajoute la prise en charge complète de MCP au mode développeur de ChatGPT

OpenAI a déployé la prise en charge complète du protocole de contexte de modèle (MCP) dans ChatGPT, offrant aux développeurs une fonctionnalité très demandée : la possibilité d'utiliser des connecteurs personnalisés pour les actions de lecture et d'écriture directement à l'intérieur des conversations. Cette fonctionnalité, maintenant en version bêta sous le mode Développeur, transforme effectivement ChatGPT en un centre d'automatisation programmable capable d'interagir avec des systèmes externes ou des API internes. Par Robert Krzaczyński
CdXz5zHNQW_SmeOwNPgDz.jpeg

Tour d'horizon des actualités Java : Jakarta Query et les étapes de Spring, Open Liberty, Camel, Quarkus, Grails

Le tour d'horizon Java de cette semaine du 6 octobre 2025 met en avant les actualités suivantes : les versions majeures de Jakarta Query 1.0, Spring AI 1.1 et Spring Batch 6.0 ; l'édition d'octobre 2025 d'Open Liberty ; les versions mineures de Quarkus, Apache Camel et JetBrains Ktor. Par Michael Redlich
CdXz5zHNQW_lz0laviiL7.jpeg

Étude d'OpenAI : les causes des hallucinations des LLM et les solutions potentielles

Dans un récent article de recherche, OpenAI suggère que la tendance des LLM à halluciner provient de la façon dont les méthodes standard de formation et d'évaluation récompensent les suppositions plutôt que la reconnaissance de l'incertitude. Selon l'étude, cette compréhension pourrait ouvrir la voie à de nouvelles techniques pour réduire les hallucinations et construire des systèmes d'IA plus fiables, mais tous ne sont pas d'accord sur ce que sont les hallucinations en premier lieu. Par Sergio De Simone
CdXz5zHNQW_LOrZ6MRXPd.jpeg

AWS présente les instances gérées ECS pour les applications conteneurisées

AWS a récemment annoncé Amazon ECS Managed Instances, une nouvelle fonctionnalité dans ECS conçue pour simplifier le déploiement d'applications conteneurisées sur des instances EC2. Le service gère automatiquement la provision, la mise à l'échelle et la maintenance des instances, réduisant ainsi les coûts d'exploitation liés à la maintenance de l'infrastructure de conteneurs. Par Renato Losio
CdXz5zHNQW_AfnPEbSnXH.jpeg

Claude Sonnet 4.5 dépasse les sommets de SWE-Bench vérifié, étend le focus de codage au-delà de 30 heures

Le Claude Sonnet 4.5 d'Anthropic, son modèle de codage le plus avancé, excelle dans les performances et la sécurité des tâches, obtenant un score de sécurité de 98,7 % et améliorant les capacités de codage dans le monde réel. Les compétences de raisonnement améliorées permettent des tâches multi-étapes soutenues, avec des gains notables signalés par les utilisateurs. Ce remplacement intégré démontre un équilibre puissant entre capacité et sécurité pour les utilisateurs. Par Hien Luu
CdXz5zHNQW_OcmOujUG6G.jpeg

PlanetScale étend sa plateforme de base de données à PostgreSQL

PlanetScale a annoncé la disponibilité générale de son service Postgres fragmenté géré, conçu pour les performances et la fiabilité sur AWS ou Google Cloud. Le lancement étend les offres de PlanetScale aux utilisateurs de PostgreSQL, ajoutant à la plate-forme existante basée sur MySQL de l'entreprise, construite au-dessus de Vitess. Par Renato Losio
CdXz5zHNQW_iTpHKnfYyx.jpeg

Google DeepMind présente CodeMender, un agent d'IA pour la réparation automatisée de code

Google DeepMind a présenté CodeMender, un nouvel agent basé sur l'IA conçu pour détecter, corriger et sécuriser automatiquement les vulnérabilités logicielles. Le projet s'appuie sur les récentes avancées des modèles de raisonnement et de l'analyse de programmes, dans le but de réduire le temps que les développeurs consacrent à l'identification et à la correction des problèmes de sécurité. Par Robert Krzaczyński
CdXz5zHNQW_l7Xu54O5Nf.jpeg

Présentation : Déployer des systèmes RAG multimodaux avec vLLM

Stephen Batifol discute de la construction et de l'optimisation de systèmes RAG multimodaux auto-hébergés. Il décompose la recherche vectorielle, les index de plus proches voisins (FLAT, IVF, HNSW) et le rôle essentiel du choix du bon modèle d'intégration. Il explique ensuite l'optimisation de l'inférence vLLM (attention paginée, quantification) et utilise Pixtral de Mistral pour détailler l'architecture des grands modèles de langage multimodaux. Par Stephen Batifol
CdXz5zHNQW_0ymDaihHg4.jpeg

OpenAI DevDay 2025 présente l'API GPT-5 Pro, l'Agent Kit et plus encore

Lors de la DevDay 2025 d'OpenAI, AgentKit ainsi que les modèles GPT-5 Pro et Sora 2 ont été dévoilés, permettant des expériences logicielles interactives directement au sein de ChatGPT. Ce passage aux « applications dans ChatGPT » favorise la collaboration et la commercialisation au sein des conversations. Des options de self-hosting améliorées et des SDK robustes permettent aux développeurs et rationalisent les flux de travail, positionnant OpenAI à l'avant-garde de l'innovation en matière d'IA. Par Andrew Hoblitzell
CdXz5zHNQW_phqdBUnt0u.jpeg

Data API Builder 1.6 ajoute des contrôles d'en-tête HTTP et une journalisation flexible

Microsoft a publié Data API Builder (DAB) 1.6, élargissant les capacités du runtime open-source pour les points de terminaison REST et GraphQL sur Azure SQL, PostgreSQL, MySQL et Cosmos DB. La nouvelle version introduit des comportements avancés d'en-tête HTTP pour un meilleur contrôle côté client et un sous-système de journalisation remanié conçu pour améliorer le diagnostic et l'observabilité dans les déploiements cloud et sur site. Par Edin Kapić
CdXz5zHNQW_Kv16UNi6Fd.jpeg

Calendrier de QCon AI New York 2025 publié, mettant en avant l'IA d'entreprise pratique

Le programme de QCon AI New York 2025 est désormais disponible pour l'événement qui se tiendra du 16 au 17 décembre. Axé sur le passage de l'IA du PoC à la production, le programme offre une feuille de route pratique pour les ingénieurs seniors et les leaders technologiques. Il aborde les défis concrets de la construction, de la mise à l'échelle et du déploiement de systèmes d'IA fiables et de niveau entreprise, aidant les organisations à surmonter les obstacles de la mise en production de leurs initiatives d'IA. Par Artenisa Chatziou
CdXz5zHNQW_bzUt8gOU3r.jpeg

GitHub présente un nouveau modèle d'intégration pour améliorer la recherche et le contexte du code

GitHub a introduit un nouveau modèle d'intégration pour Copilot, désormais intégré à Visual Studio Code. Le modèle est conçu pour améliorer la façon dont Copilot comprend le contexte de programmation, récupère le code pertinent et suggère des complétions. Par Daniel Dominguez
CdXz5zHNQW_1kEkrrlgzK.jpeg

Cloudflare atteint un taux de démarrage à chaud de 99,99 % pour les Workers grâce au hachage cohérent "Shard and Conquer".

La technique innovante "Shard and Conquer" de Cloudflare révolutionne sa plateforme serverless en réduisant les temps de démarrage à froid de 90 %. En utilisant un anneau de hachage cohérent, elle achemine le trafic efficacement, maintient les Workers actifs et minimise la latence. Améliorée pour les applications plus importantes, cette approche garantit des performances optimales tout en répondant aux demandes des utilisateurs pour des fonctionnalités plus riches. Par Steef-Jan Wiggers
CdXz5zHNQW_Hr9ng7ooaa.jpeg

Podcast : Utiliser la science du cerveau pour communiquer et diriger efficacement des équipes techniques

Dans ce podcast, Shane Hastie, rédacteur en chef pour Culture & Méthodes, s'entretient avec Charlotte de Jong Schouwenburg sur la manière dont la compréhension des sciences du cerveau et de l'intelligence émotionnelle peut aider les ingénieurs et les leaders techniques à améliorer la communication, à gérer les conflits et à constituer des équipes plus solides. Par Charlotte de Jong Schouwenburg
CdXz5zHNQW_l3mkEKA9z3.jpeg

Article : Explorer les conséquences imprévues de l'automatisation dans le logiciel

Cet article expose certaines des hypothèses et idées fausses courantes concernant l'automatisation et son rôle dans les logiciels (et les incidents logiciels), ce que nos recherches ont révélé sur la manière dont l'automatisation se manifeste dans les incidents logiciels, et quelques idées sur la façon dont les gens peuvent mieux concevoir des outils automatisés pour aider les gens à mieux gérer les incidents logiciels. Par Courtney Nash
CdXz5zHNQW_picGMhi4XH.jpeg

Le nouveau serveur MCP du Data Commons ouvre une mine de jeux de données publics pour les développeurs d'IA

Google a récemment introduit le serveur du protocole de contexte du modèle de données communes (MCP), un outil qui permet aux développeurs et aux chercheurs en IA d'accéder facilement à la collection de jeux de données publics disponibles via Data Commons. Par Sergio De Simone
CdXz5zHNQW_gTQ1OfamnX.jpeg

Google DeepMind lance le modèle d'utilisation informatique Gemini 2.5 pour alimenter les agents d'IA contrôlant l'interface utilisateur.

Google DeepMind a récemment publié le modèle Gemini 2.5 Computer Use, une variante spécialisée de son système Gemini 2.5 Pro conçue pour permettre aux agents IA d'interagir directement avec des interfaces utilisateur graphiques. Le nouveau modèle permet aux développeurs de créer des agents capables de cliquer, taper, faire défiler et manipuler des éléments interactifs sur des pages Web. Par Robert Krzaczyński
CdXz5zHNQW_1Bx03Hx3Ms.jpeg

Combiner la livraison continue avec la programmation en binôme : leçons apprises

La programmation en binôme et l'intégration continue peuvent aller de pair. Pousser vers la branche principale plusieurs fois par jour est difficile en solo, entraînant des retards, de gros PR et des problèmes de fusion, ont mentionné Ola Hast et Asgaut Mjølne Söderbom lors de leur présentation sur la livraison continue avec la programmation en binôme à QCon London. Le binômage permet une revue de code instantanée, un refactoring plus facile, moins de bugs et une plus grande résilience de l'équipe. Par Ben Linders
CdXz5zHNQW_exCleLzkqo.jpeg

Azure Container Storage v2.0.0 devient GA avec une amélioration majeure des performances

Microsoft a publié Azure Container Storage v2.0.0, introduisant des améliorations de performance significatives et des simplifications architecturales pour les charges de travail stateful sur Azure Kubernetes Service (AKS). La version met l'accent sur une intégration plus poussée des NVMe, une expérience utilisateur simplifiée et une disponibilité open-source élargie, tout en supprimant tous les frais de service au-delà des coûts de stockage sous-jacents. Par Claudio Masolo
CdXz5zHNQW_PekTJbnyhV.jpeg

IBM publie Granite-Docling-258M, un modèle compact vision-langage pour une conversion précise de documents.

IBM Research a récemment présenté Granite-Docling-258M, un nouveau modèle vision-langage (VLM) open-source conçu pour la conversion document-texte haute fidélité tout en préservant les mises en page complexes, les tableaux, les équations et les listes. Par Robert Krzaczyński
CdXz5zHNQW_VX6iVqc87T.jpeg

11 sessions à ne pas manquer à QCon San Francisco 2025

À l'approche de QCon San Francisco (17-21 novembre 2025), le comité de programme et les responsables des sessions de la conférence partagent leurs choix préférés parmi la programmation de cette année. Leurs sélections couvrent un large éventail de sujets, du développement accéléré par l'IA et l'ingénierie des plateformes aux schémas de résilience et à l'évolution de carrière, le tout avec l'accent signature de QCon sur les études de cas réelles et les leçons apprises. Par Artenisa Chatziou.
CdXz5zHNQW_qMJhQpY8PS.jpeg

Présentation : Construire des architectures distribuées pilotées par les événements au-delà des limites multi-cloud

Teena Idnani explique comment concevoir et construire des systèmes distribués pilotés par les événements et résilients dans une réalité multi-cloud. En utilisant le parcours de migration d'une banque fictive, elle partage des solutions pratiques au niveau du code pour surmonter les principaux défis : gérer la latence entre les clouds, assurer l'ordre et la cohérence des événements, construire la résilience par la conception et prévenir les événements en double. Par Teena Idnani.
CdXz5zHNQW_TfM0MTP3Jb.jpeg

Meta Ships React 19.2 avec l'API d'activité, les signaux de cache et les améliorations du SSR

React 19.2 introduit de nouvelles API et des améliorations de performance axées sur un meilleur contrôle de l'interface utilisateur et le rendu côté serveur. Les ajouts clés incluent le nouveau composant Activity pour gérer les états de l'interface utilisateur sans perdre l'état du composant, et le hook useEffectEvent, qui sépare la logique des événements des dépendances d'effet. Par Daniel Curtis
CdXz5zHNQW_mX04zY4xke.jpeg

Produire une meilleure architecture logicielle avec la théorie de la résidualité

L'architecture logicielle est difficile car elle mêle le codage, les mathématiques et les systèmes commerciaux. En raison des surprises, les architectures ont tendance à devenir obsolètes avec le temps, a déclaré Barry O'Reilly. Il a présenté la théorie de la résidualité, où il a suggéré de mettre l'accent sur les architectures naïves pour révéler les "attracteurs" cachés dans des systèmes commerciaux complexes. Cela permet aux conceptions de mieux survivre au changement et à l'incertitude. Par Ben Linders
CdXz5zHNQW_XrAkXf4kB7.jpeg

Thinking Machines publie l'API Tinker pour un réglage fin flexible des modèles

Thinking Machines a publié Tinker, une API pour le réglage fin des modèles de langage à poids ouverts. Le service est conçu pour réduire les frais d'infrastructure pour les développeurs, en fournissant une planification gérée, l'allocation de GPU et la gestion des points de contrôle. En abstraisant la gestion des clusters, Tinker permet le réglage fin grâce à de simples appels Python. Par Daniel Dominguez
CdXz5zHNQW_2vQSE29CG6.jpeg

Dreamer 4 : Apprendre à atteindre des objectifs à partir de données hors ligne grâce à l'entraînement par imagination

Des chercheurs de DeepMind ont décrit une nouvelle approche pour apprendre aux agents intelligents à résoudre des tâches complexes et à long terme en les entraînant exclusivement sur des séquences vidéo plutôt qu'à travers une interaction directe avec l'environnement. Leur nouvel agent, baptisé Dreamer 4, a démontré sa capacité à miner des diamants dans Minecraft après avoir été entraîné sur des vidéos, sans jamais avoir joué au jeu. Par Sergio De Simone
CdXz5zHNQW_byy3XJiKz3.jpeg

Uber atteint 150 millions de lectures par seconde grâce aux améliorations de CacheFront

Uber a mis à jour son architecture CacheFront pour gérer plus de 150 millions de lectures par seconde. La nouvelle conception améliore la cohérence et réduit les lectures obsolètes en intégrant Flux pour le suivi des binlogs MySQL, en améliorant le moteur de stockage et en introduisant Cache Inspector pour la surveillance et l'optimisation. Par Leela Kumili
CdXz5zHNQW_bRc8kr4y8n.jpeg

Présentation : Des bases à l'entreprise : Le parcours de Vanguard dans la transformation SRE

Christina Yakomin partage la transformation SRE de Vanguard : des tests trimestriels de monolithes à un modèle DevOps mature avec livraison continue. Elle explique le centre de coaching SRE, les outils en libre-service et les techniques avancées comme la mise à l'échelle automatique du taux de requêtes. Elle détaille les défis modernes, y compris les journées de simulation de défaillance régionale et les tests de centres de contact basés sur l'IA. Par Christina Yakomin
CdXz5zHNQW_j22hdWfN2d.jpeg

Podcast : Elena Samuylova sur l'évaluation des applications basées sur les grands modèles linguistiques (LLM) et le LLM comme juge

Dans ce podcast, InfoQ s'est entretenu avec Elena Samuylova d'Evidently AI, sur les meilleures pratiques pour évaluer les applications basées sur de grands modèles linguistiques (LLM). Elle a également discuté des outils d'évaluation, de test et de surveillance des applications alimentées par des technologies d'IA. Par Elena Samuylova
CdXz5zHNQW_6Xps3EQ2qn.jpeg

Java News Roundup : Calendrier de sortie du JDK 26, GlassFish, Spring AI, Helidon, Mandrel 25, Seed4j

Le résumé Java de cette semaine pour le 29 septembre 2025, présente des nouvelles mettant en avant : JEP 527, Post-Quantum Hybrid Key Exchange pour TLS 1.3 ; le calendrier proposé pour la sortie de JDK 26 ; la sortie de Mandrel 25 et Seed4j ; les versions milestone de GlassFish 8.0 et 7.1 ; la version bêta de WildFly 38 ; et les versions ponctuelles de Spring AI, Helidon, Micronaut, LangChain4j, Gatherers4j et Keycloak. Par Michael Redlich
CdXz5zHNQW_yn6nyuGBIQ.jpeg

Nouveau service DNS Armor aide les charges de travail Google Cloud à bloquer de manière préventive les cybermenaces

DNS Armor de Google Cloud, en partenariat avec Infoblox, offre une couche de sécurité essentielle contre les menaces basées sur le DNS pour les charges de travail Google Cloud. Utilisant une détection avancée des menaces et l'apprentissage automatique, il identifie et atténue les risques tels que les logiciels malveillants et l'exfiltration de données, garantissant une protection robuste sans impacter les performances. Déployable en tant que service géré offrant un contrôle transparent aux utilisateurs. Par Steef-Jan Wiggers
CdXz5zHNQW_c40xF99WND.jpeg

Vercel présente les Drains pour l'exportation unifiée des données

Vercel a publié Vercel Drains, un système permettant d'exporter les données d'observabilité de sa plateforme vers des services externes. Cette fonctionnalité unifie les journaux, les traces distribuées, les événements d'analyse web et les métriques de performance dans un seul mécanisme de streaming. Par Daniel Dominguez
CdXz5zHNQW_lT6AGvRepx.jpeg

AWS lance les instances Mac M4 et M4 Pro pour un développement d'applications Apple plus rapide

AWS a récemment lancé deux nouvelles instances Mac (M4 et M4 Pro) basées sur le dernier silicium M4 d'Apple. Les nouvelles instances EC2 offrent des performances CPU plus rapides, des graphismes améliorés et une mémoire accrue pour la création d'applications iOS et macOS. Par Renato Losio
CdXz5zHNQW_IJkr2FX96W.jpeg

Agoda utilise ChatGPT dans le processus CI/CD pour l'optimisation des procédures stockées SQL

Agoda a commencé à utiliser ChatGPT pour optimiser les procédures stockées SQL (SP) dans le cadre de son processus CI/CD. Après avoir introduit l'étape automatisée assistée par LLM, l'entreprise a constaté une réduction des temps d'optimisation des procédures stockées, ce qui a allégé la charge de travail des développeurs de bases de données. Agora travaille à rendre ChatGPT plus accessible pour l'optimisation des SP en dehors du pipeline CI/CD. Par Rafal Gancarz
CdXz5zHNQW_K5bX7UcKdx.jpeg

Présentation : Mise à l'échelle du BBC Design System : Outillage, Communauté, Gouvernance et Jardinage

Sophie Beaumont explique comment le système de conception web de la BBC prend en charge plus de 10 marques et 25 équipes d'ingénierie, traitant 4,8 milliards de requêtes par mois. Elle présente leur modèle de contribution fédéré, qui combine automatisation, propriété obligatoire et approche collaborative de jardinage pour créer un système évolutif, maintenable et hautement accessible. Par Sophie Beaumont
CdXz5zHNQW_W2fdIE2aUq.jpeg

Anthropic révèle trois bugs d'infrastructure à l'origine des problèmes de performance de Claude

Anthropic a récemment publié un post-mortem révélant que trois bugs d'infrastructure distincts ont dégradé par intermittence la qualité des sorties de ses modèles Claude ces dernières semaines. Bien que l'entreprise affirme avoir résolu ces problèmes et modifie ses processus internes pour éviter des perturbations similaires, la communauté souligne les défis liés à l'exploitation du service sur trois plateformes matérielles. Par Renato Losio
CdXz5zHNQW_n2H35hVJYI.jpeg

Podcast : Bâtir une culture d'ingénierie par l'autonomie et la responsabilisation

Dans ce podcast, Shane Hastie, rédacteur en chef pour Culture & Méthodes, s'entretient avec Marcos Arribas de la construction et de la mise à l'échelle de la culture d'ingénierie à mesure qu'une organisation se développe, en mettant l'accent sur les équipes autonomes, la mentalité de propriété, les déploiements progressifs de fonctionnalités avec des drapeaux, les petites demandes d'extraction, l'adoption stratégique de l'IA et l'importance d'embaucher des ingénieurs juniors pour la croissance organisationnelle à long terme. Par Marcos Arribas
CdXz5zHNQW_1d3isB0lJb.jpeg

Article : Apporter l'inférence IA à Java avec ONNX : un guide pratique pour les architectes d'entreprise

Les applications Java peuvent désormais exécuter des modèles d'IA basés sur des transformeurs directement dans la JVM, sans Python, sans wrappers REST ni microservices. Ce guide montre comment intégrer l'inférence alimentée par ONNX avec la prise en charge des tokenizers, l'accélération GPU, le déploiement modulaire et l'observabilité, permettant aux architectes dans les domaines réglementés d'adopter l'IA sans perturber la conformité ou les flux de travail CI/CD. Par Syed Danish Ali
CdXz5zHNQW_PqQ8YVnCEy.jpeg