分類および回帰木(CART)は、分類および回帰タスクの両方に使用される非パラメトリック方法です。このテキストでは、特に回帰タスクに焦点を当て、連続的な出力変数を予測することを目指しています。CARTアルゴリズムは、入力変数と分割点に基づいてデータセットを二分木に分割し、ターミナルノードに達するまで繰り返します。この分割プロセスにより、データはサブセットに分割されます。特徴選択は非常に重要であり、貪欲アルゴリズムを使用して最適な入力変数と分割点を探します。二分木は、選択された特徴に基づいてデータを2つの子ノードに分割します。木の構築プロセスは再帰的であり、事前に定義された基準(例えば、最小サンプルサイズや最大深度)に達するまで停止します。木の剪定は、予測の正確さを向上させる枝を削除するために、完全な木が構築された後に行われます。CARTの汎用性により、分類および回帰問題の両方を処理できるため、多くの分野で適用できます。医療では、疾患の可能性や術後の合併症を予測するために使用され、金融では、顧客の信用worthinessを評価するために多くの金融変数に基づいて使用されます。
dev.to
Regression with CART Trees
Create attached notes ...
