구글 제미니로 물리 검증 엔진을 만들었습니다. 700번의 테스트와 12개월 동안 얻은 교훈입니다.

Flamehaven-TOE는 끈 이론을 위한 물리학 검증 파이프라인으로, 가설을 텐서로 변환하고 불일치를 감지하기 위해 실패 채널을 실행합니다. 오픈 소스 대안이 없어 만들어진 이 시스템은 현재 700개의 통과 시험을 보유하고 있습니다. 제미니의 가치는 물리 방정식과 디버깅을 위한 파이썬 코드를 연결하는 데 있었습니다. 핵심 초점은 물리적 모델을 생성하는 것이 아니라 검증에 있습니다. 슈뢰딩거의 고양이 비유는 측정될 때까지 여러 배치가 중첩된 끈 풍경에서 검증의 필요성을 보여준다. 파이프라인은 물리적 제약 조건(BETA, BRST, PDE)에 따라 구성을 PASS 또는 FAIL으로 분류하는 측정 도구 역할을 합니다. 파이프라인에는 스트링 배경 장을 평가하기 위해 물리 에이전트를 사용하는 여러 모듈이 있습니다. 테스트는 공개된 솔루션과 비교해 검증하며, 레이어 2 교차 검증을 통해 결과를 확인합니다. 실시간 결과는 파이프라인이 일관된 (WZW S^3 모델)과 불일치(선형 딜라톤, D=4) 시나리오를 모두 식별할 수 있음을 보여줍니다. WZW S^3 테스트는 RAG 시스템만으로는 불가능한 전역 특성을 검증하는 파이프라인의 중요성을 강조합니다. 파이프라인은 물리 코어 파일들이 코드베이스에서 가장 깨끗하다는 것을 발견했습니다. 제미니의 주요 기능은 특히 T-쌍대성과 같은 복잡한 변환을 위해 공식을 코드로 변환하는 것이었으며, 대수적 무결성을 유지하는 것이었다. 이 프로젝트의 발전은 쌍둥이자리의 모델 업그레이드와 병행하여 모듈 생성에서 시작해 동시 다단계 텐서 도출로 진화했습니다. 최신 버전인 Gemini 3.1 Pro는 더 깊은 추론과 게이트 차별화를 가능하게 하여 분석과 검증 정확도를 향상시켰습니다.

dev.to

I Built a Physics Verification Engine with Google Gemini. Here's What 700 Tests and 12 Months Taught Me.

RSS Hunter

2026-03-04