LLM을 가이드 생성으로 다스리다
대규모 언어 모델(LLM)은 강력하지만 예측할 수 없다. 구조화된 데이터를 출력하도록 하는 것은 어려운 일이다. 마치 가정을 통해 훈련하는 것은 자원 집약적이므로 가이드 생성이 중간 지점을 제공한다. 이 기술은 LLM의 출력을 재훈련하지 않고 제약을 사용하여 조정한다.
이 기사는 마이크로소프트의 가이드 라이브러리와 다음과 같은 응용 프로그램을 살펴본다.
- 텍스트 분류: 사전 정의된 그룹(예: 긍정, 부정, 중립)으로 텍스트를 분류하는 것.
- 고급 프롬프트: 체인-오브-사고(Chain-of-Thought, CoT)와 같은 기술을 구현하여 추론을 개선하는 것.
- 엔티티 추출: 특정 정보(날짜, 주소)를 구조화된 형식으로 추출하는 것.
- 도구 사용: 외부 도구와 통합하여 날짜 계산 또는 문자열 조작과 같은 작업을 수행하는 것.
이점
- 원하는 출력 형식을 강제하여 후속 처리를 제거한다.
- 정확도와 예측 가능성을 개선시킨다.
- 제약이 없는 생성보다 빠를 수 있다.
단점
- 경우에 따라 더 느릴 수 있다.
- 비자연스러운 출력을 강제하여 환각을 증가시킬 수 있다.
결론
가이드 생성, 특히 가이드와 같은 도구를 사용하여 LLM의 사용성을 향상시킬 수 있다. 예측 가능성을 개선하고, 다른 도구와의 통합을简화하며, 후속 처리 노력을 줄인다.
코드와 라이브 데모를 보려면 다음 링크를 방문하라.
코드: https://github.com/CVxTz/constrained_llm_generation
데모: https://guidance-app-kpbc8.ondigitalocean.app/
towardsdatascience.com
Save Time and Effort When Building LLM Apps Using Guided Generation
Create attached notes ...