RSS VentureBeat
팔로우
AI 에이전트 업데이트가 성능 향상에 도움이 될까요, 아니면 방해가 될까요? Raindrop의 새로운 도구 Experiments가 그 답을 알려드립니다.
AI 애플리케이션 관측 스타트업인 Raindrop가 엔터프라이즈 AI 에이전트 전용 A/B 테스트 스위트인 "Experiments"를 출시했습니다. 이 새로운 기능은 기업이 기본 모델, 지침 및 도구 접근 방식의 변경 사항을 기반으로 다양한 AI 에이전트의 성능을 비교할 수 있도록 합니다. Experiments는 Raindrop의 기존 도구를 확장하여 AI 에이전트가 실제 사용자 상호 작용에서 어떻게 동작하고 진화하는지에 대한 통찰력을 제공합니다. 이 플랫폼은 수백만 건의 상호 작용에서 AI 성능에 대한 변경 사항의 영향을 추적하고 결과를 시각화하며 긍정적 및 부정적 신호를 모두 강조합니다. 이 도구는 AI 에이전트 반복에 현대적인 소프트웨어 배포의 엄격함을 도입하여 데이터 기반 개선을 촉진하는 것을 목표로 합니다. Raindrop의 핵심 미션은 AI의 "블랙 박스 문제"를 해결하여 팀이 AI 시스템이 실패하는 이유와 방식을 이해하도록 돕는 것이었습니다. Experiments는 "평가는 통과하지만 에이전트는 실패하는" 일반적인 문제를 실제 에이전트 동작에 초점을 맞춰 해결합니다. 이 플랫폼은 개발자가 작업 실패 또는 예상치 못한 오류와 같은 문제를 신속하게 식별하고 수정하는 데 도움이 되는 이해하기 쉬운 데이터를 제공합니다. Experiments는 기능 플래그 플랫폼 및 기존 분석 파이프라인과 통합되어 충분한 사용자 데이터를 통해 정확한 비교를 보장합니다. Raindrop은 PII (개인 식별 정보) 삭제 옵션 및 SOC 2 규정 준수를 포함한 포괄적인 데이터 보안과 다양한 가격 계획을 제공합니다. 회사는 지속적인 개선을 강조하며, 실제 사용자 데이터를 우선시하여 개발자가 더 빠르게 움직이고 더 나은 성능의 AI 모델을 출시할 수 있도록 돕는 것을 목표로 합니다.