Coin3D는 Objaverse의 LVIS 하위 집합을 사용하여 16뷰 렌더링과 프록시 복셀화를 통해 학습됩니다. 평가에는 CLIP 점수, ImageReward 및 GPTEvals3D가 포함됩니다. 사용자 연구는 기존 방법과의 출력을 비교합니다. 이 모델은 Nvidia A100-80G에서 이중 3D UNet과 volume-SDS 손실을 사용하여 학습되며, 고품질의 3D 재구성을 단 몇 분 만에 가능하게 하여 품질과 효율성을 모두 최적화합니다.
hackernoon.com
Coin3D Optimizes Training and Evaluation for High-Fidelity 3D Generation
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
Create attached notes ...
