RSS DZone.com
Подписаться
Активное обучение и человеческое вмешательство для разметки данных и улучшения моделей в обработке естественного языка
Модели обработки естественного языка (NLP) в значительной степени зависят от данных, но получение высококачественных размеченных данных в больших объемах является одним из самых больших препятствий. Быстро становится ясно, что добавление большего количества необработанных данных к задаче NLP особо не помогает — именно размеченные данные действительно стимулируют улучшения. Именно здесь незаменимыми становятся активное обучение и подход с участием человека в цикле. Они помогают нам приоритизировать, какие данные размечать, привлекать человеческий опыт в критических точках и постоянно улучшать модели в производстве.
В этой статье мы обсудим, что такое активное обучение, как реализовать рабочий процесс с участием человека в цикле для аннотирования NLP, и почему этот подход ускоряет улучшение моделей.