Google의 DiffusionGemma는 256개의 토큰을 병렬로 생성하며 진행하면서 자체 수정합니다.

팔로우

Google의 DiffusionGemma는 256개의 토큰을 병렬로 생성하며 진행하면서 자체 수정합니다.

생성형 AI 이미지 생성기는 노이즈에서 시작하여 전체 이미지를 반복적으로 개선하는 확산을 사용합니다. 이 확산 원리를 대규모 텍스트 생성에 적용하는 것은 이전에 어려웠습니다. 표준 언어 모델은 타자기처럼 토큰별로 텍스트를 생성하므로 로컬 배포 시 GPU 유휴 시간이 발생할 수 있습니다. Google의 DiffusionGemma는 프로덕션 규모의 텍스트 생성에 확산을 적용하는 실험적인 오픈 소스 모델입니다. 256개 토큰 블록에서 병렬로 작동하며, 각 토큰 위치는 다른 모든 토큰에 주의를 기울여 생성 속도를 크게 향상시킵니다. DiffusionGemma는 특히 낮은 배치 크기에서 GPU에서 표준 모델보다 최대 4배 빠르게 텍스트를 생성합니다. 이 모델은 무작위 플레이스홀더 토큰에서 시작하여 전체 블록을 점진적으로 개선하여 자체 수정 및 양방향 컨텍스트를 허용합니다. 이 아키텍처는 스도쿠 퍼즐 해결에 성공한 것처럼 제약된 생성 작업에 유리하다는 것이 입증되었습니다. 더 빠르지만, DiffusionGemma의 전반적인 출력 품질은 Google에서 표준 Gemma 4보다 낮다고 인정했습니다. 속도 이점은 주로 GPU 컴퓨팅이 풍부한 로컬 추론 및 낮은 동시성 시나리오에서 나타납니다. 높은 처리량의 클라우드 서비스의 경우 이점은 줄어들고 표준 자기회귀 모델이 더 효율적입니다. DiffusionGemma는 순차적 토큰 예측이 아닌 병렬 블록 노이즈 제거에 중점을 둔 생성의 패러다임 전환을 나타냅니다.

Google's DiffusionGemma generates 256 tokens in parallel and self-corrects as it goes venturebeat.com

RSS Hunter • 6월 11일