L'essor de l'IA agente, qui peut penser, planifier et agir de manière autonome en temps réel, a changé le paysage informatique. Les modèles d'IA agente peuvent travailler ensemble pour résoudre des problèmes, nécessitant une nouvelle fondation informatique avec un traitement de données à latence ultra-faible, une raisonnablement consciente de la mémoire et une orchestration dynamique. Pour répondre à ces exigences, l'industrie se tourne vers des siliciums personnalisés conçus spécifiquement pour les agents autonomes. Les leaders technologiques comme Meta, OpenAI et Google conçoivent conjointement des siliciums, des infrastructures et des couches d'orchestration pour alimenter le premier travailleur digital véritablement autonome au monde. Ils investissent dans des systèmes de supercalcul, des technologies de refroidissement et des racks de serveurs à haute densité optimisés pour l'IA pour gérer les ressources pour des milliers d'agents AI concurrents. L'IA agente nécessite une spécialisation matérielle beaucoup plus importante pour répondre aux exigences constantes d'inférence, et les entreprises technologiques partenaires avec les fabricants de puces pour construire des siliciums conçus spécifiquement pour l'inférence à faible latence. Pour éviter les goulots d'étranglement d'inférence, les entreprises développent des puces personnalisées et embauchent des ingénieurs de codesign logiciel-matériel. Le passage de la calcul générale à du silicium conçu à dessein est nécessaire pour répondre aux exigences de l'IA agente, et des entreprises comme AMD lancent de nouveaux GPU conçus pour accélérer les charges de travail à travers l'IA agente, l'IA générative et le calcul haute performance. L'efficacité énergétique est maintenant une priorité de conception clé, avec des fournisseurs d'infrastructure livrant des puces d'IA edge et des racks de centre de données conçus pour la cognition distribuée. Malgré l'élan croissant, des défis clés persistent, notamment justifier la valeur des initiatives d'IA agente et gérer les coûts imprévisibles liés à l'IA.
fastcompany.com
Agentic AI is driving a complete rethink of compute infrastructure
