RSS DZone.com
Подписаться
Улучшение производительности с помощью решений GenAI на основе RAG (Retrieval-Augmented Generation).
Итак, что же такое RAG? Проще говоря, это аббревиатура от "Retrieval-Augmented Generation" (извлечение с дополнением генерацией). Давайте сосредоточимся на этих двух аспектах: извлечении и генерации. В стандартном генеративном искусственном интеллекте (GenAI) вы предоставляете запрос, и приложение GenAI использует большую языковую модель для создания подходящего ответа на этот запрос. Теперь представьте себе приложение, которое может извлекать информацию из различных источников, а затем генерировать ответ на основе извлеченной информации. Именно так и работает RAG GenAI. Он предоставляет контекст для сгенерированного примера.
Давайте рассмотрим это подробнее на примере. Если мы спросим что-то вроде "Какой лучший способ сделать резервную копию моей базы данных клиентов?" приложению GenAI, оно, вероятно, ответит какой-то общей информацией. Ему не будут известны детали базы данных клиентов, о которой я говорю. Теперь предположим, что у меня есть документ с дизайном, содержащий все детали. В нем есть раздел о хранилищах данных, в котором явно перечислена база данных клиентов, размещенная на Amazon DynamoDB. Документ с дизайном загружен в SharePoint моей организации. Таким образом, приложение сначала выполнит извлечение контекстной информации из SharePoint, дополнит запрос извлеченной информацией, а затем сгенерирует ответ на его основе. В этом случае приложение предоставит стратегии резервного копирования базы данных DynamoDB и направит меня к соответствующим разделам в моем документе с дизайном.