실시간 자율 작동이 가능한 에이전트 AI의 부상은 컴퓨팅 랜드스케이프를 변화시켰다. 에이전트 AI 모델은 문제를 해결하기 위해 함께 작동할 수 있으며, 이를 지원하기 위해 초저지연 데이터 처리, 메모리 인지, 및 동적 오케스트레이션이 필요한 새로운 컴퓨팅\Foundation이 필요하다. 이러한 요구를 충족하기 위해 업계는 자율 에이전트를 위해 특별히 설계된 커스텀 실리콘으로 이동하고 있다. 메타, 오픈AI, 구글 등의 테크 리더들은 실리콘, 인프라, 오케스트레이션 레이어를 코드 설계하여 세계 최초의 진정한 자율 디지털 워크포스를 구동하고 있다. 그들은 수천 개의 동시 AI 에이전트를 관리하는 슈퍼컴퓨팅 시스템, 냉각 기술, 및 AI 최적화 고밀도 서버 랙에 투자하고 있다. 에이전트 AI는 지속적인 추론 요구를 지원하기 위해 하드웨어 전문화가 훨씬 더 필요하며, 테크 회사들은 칩 메이커와 파트너쉽을 맺어 저지연 추론을 위한 실리콘을 구축하고 있다. 추론 병목 현상을 피하기 위해 회사들은 커스텀 칩을 개발하고 하드웨어-소프트웨어 코드 설계 엔지니어를 고용하고 있다. 에이전트 AI의 요구를 지원하기 위해 브로드 컴퓨트에서 목적 지향 실리콘으로의 전환은 필요하며, AMD와 같은 회사는 에이전트 AI, 생성 AI, 및 고성능 컴퓨팅에 걸쳐 워크로드를 가속화하는 새로운 GPU를 출시하고 있다. 전력 효율은 이제 최고의 설계 우선순위가 되었으며, 인프라 제공업체들은 분산 인지에 맞춤화된 AI 에지 칩 및 데이터 센터 랙을 제공하고 있다. 그러나 성장하는 모멘텀에도 불구하고, 에이전트 AI 이니셔티브의 가치 정당화 및 예측 불가능한 AI 관련 비용 관리와 같은 주요 도전 과제가 여전히 남아 있다.
fastcompany.com
Agentic AI is driving a complete rethink of compute infrastructure
Create attached notes ...
