RSS DEV 커뮤니티

카트 트리와의 회귀

분류 및 회귀 트리(CART)는 분류 및 회귀 작업에 사용되는 비모수 방법입니다. 이 텍스트는 특히 회귀에 CART를 사용하여 연속 출력 변수를 예측하는 것을 목표로 합니다. CART 알고리즘은 입력 변수 및 분할 점에 따라 데이터셋을 반복적으로 분할하여 이진 트리를 구축합니다. 분할 프로세스는 터미널 노드에 도달할 때까지 계속되며, 데이터를 하위 집합으로 나눕니다. 기능 선택은 필수적이며, 탐욕 알고리즘을 사용하여 최적의 입력 변수 및 분할 점을 찾습니다. 이진 분할은 선택된 기능에 따라 데이터를 두 개의 자식 노드로 나눕니다. 트리 구축 프로세스는 재귀적이며, 미리 정의된 기준(예: 최소 샘플 크기 또는 최대 깊이)에 도달할 때까지 중단됩니다. 전체 트리가 구축된 후 예측 정확도를 개선하지 않는 분기를 제거하는 트리 프루닝이 수행됩니다. CART의 다재다능함으로 인해 다양한 분야에 적용할 수 있습니다. 의료 분야에서는 CART를 질병 가능성 및 수술 후 합병증 예측에 사용합니다. 금융 분야에서는 CART를 다양한 금융 변수에 기반하여 고객의 신용도를 평가하는 데 사용합니다.
favicon
dev.to
Regression with CART Trees
기사 이미지: 카트 트리와의 회귀