Дообучение забывает. RAG утека... Заметка
RSS VentureBeat

Дообучение забывает. RAG утекает контекстом. Гиперсети создают модель, которая нужна вашему агенту по требованию.

Корпоративные ИИ-агенты часто не обеспечивают устойчивой эффективности, поскольку требуют постоянного человеческого контроля. Это происходит потому, что ИИ-модели, по мере увеличения входных данных, теряют точность, становясь со временем менее надежными. Традиционные решения, такие как дообучение, рискуют катастрофическим забыванием или создают разрастание моделей, в то время как обучение в контексте страдает от "гнилости контекста" и растущих затрат. Эти методы сохраняют участие человека, поскольку не могут гарантировать, что модель является одновременно актуальной и использует правильный контекст. Многообещающей альтернативой является создание небольших, специфичных для задач моделей по запросу с использованием гиперсети. Этот подход позволяет избежать затрат на переобучение при дообучении и ограничений контекста при промптинге, создавая адаптеры моделей во время инференса. Эти сгенерированные модели являются узкими, актуальными и небольшими, что уменьшает поверхности ошибок и повышает автономность. Однако успех этого подхода с гиперсетью зависит от калибровки модели и достаточного масштаба, что является активными областями исследований. Привязка выходных данных к их источникам имеет решающее значение для обеспечения эффективной человеческой валидации, предотвращая зависимость от автоматизационного смещения. Владение улучшаемой моделью и место ее выполнения также являются критически важными соображениями. Для узких, повторяющихся задач модели, сгенерированные гиперсетью, предлагают значительные преимущества в стоимости и автономности. Для более простых, коротких задач могут быть достаточны передовые модели с хорошим промптингом. Перед покупкой важно понять, где находятся знания, механизмы привязки, триггеры эскалации и владение обратной связью.
CdXz5zHNQW_sUEPCvU2Xo.png