Vertex AI는 유해한 AI 생성 콘텐츠를 완화하기 위해 콘텐츠 필터와 시스템 지침을 제공합니다. 콘텐츠 필터는 CSAM 및 PII와 같은 금지 자료를 포함하는 출력을 차단하는 후방 방어입니다. 구성 가능한 필터는 4가지 해로움 카테고리에서 사용자 지정 임계값을 허용합니다. 시스템 지침은 모델 동작을 예방적으로 지시하여 콘텐츠 생성에 대한 더 정확한 제어를 가능하게 합니다. 이러한 지침은 안전 지침, 브랜드 목소리 및 허용 주제를 정의합니다. 시스템 지침은 필터보다 더 구체적이지만, 탈옥에 더 취약합니다. 두 방법 모두 제한이 있습니다. 필터는 거짓 긍정을 생성할 수 있으며, 지침은 과도한 주의로 이어질 수 있습니다. 둘 다 사용하여 계층적 안전 접근 방식을 구현할 수 있습니다. 조직은 구성 테스트 및 효과 측정을 위해 평가 세트를 생성해야 합니다. 최적의 전략은 특정 요구 사항 및 위험 허용에 따라 다릅니다. 두 기능의 구현을 위한 자세한 문서가 제공됩니다.
cloud.google.com
Enhance Gemini model security with content filters and system instructions
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
