Coin3D는 고충실도 3D 생성을 위한 학습 및 평가를 최적화합니다

Coin3D는 Objaverse의 LVIS 하위 집합을 사용하여 16뷰 렌더링과 프록시 복셀화를 통해 학습됩니다. 평가에는 CLIP 점수, ImageReward 및 GPTEvals3D가 포함됩니다. 사용자 연구는 기존 방법과의 출력을 비교합니다. 이 모델은 Nvidia A100-80G에서 이중 3D UNet과 volume-SDS 손실을 사용하여 학습되며, 고품질의 3D 재구성을 단 몇 분 만에 가능하게 하여 품질과 효율성을 모두 최적화합니다.