В этом посте мы покажем, как реализовать эту оценочную систему с помощью Amazon Bedrock, сравним производительность различных моделей генерации, включая Anthropic Claude и Amazon Nova на Amazon Bedrock, и продемонстрируем, как использовать новую функцию оценки RAG для оптимизации параметров базы знаний и оценки качества поиска информации.
aws.amazon.com
Evaluate healthcare generative AI applications using LLM-as-a-judge on AWS
