CART 

Classification And Regression Treesの略。
二進再帰分割法として知られている。基本的な原理はツリー形式で分類をしていき、ターミナルノードを予測値とする。
例えば、PCのうちユーザーはどれを好むのかという問題に対して、分岐ルールをいろいろと変化させながら重大な要因を見つけ出していくというような使われ方をされる。あるいは、様々な広告媒体に対して実際にアクションを起した消費者の階層を知るというような場合にも有用でしょう。
類似の手法であるCHAIDのようにターミナルノードにたどり着いたら分岐を止めるのではなくツリーの成長が止まるところまで計算するというのがCARTの特徴。

CART(Classification And Regression Trees)は、Brian RipleyによるRのパッケージ「tree」で可能。
Windowsのバイナリも用意されている。
これをダウンロードの上、解凍して
rw1031\library
に展開して利用します。
rw1031\library\tree

>library(MASS)
>library(tree)
>data(cpus)
>cpus.ltr <- tree(log10(perf) ~ syct+mmin+mmax+cach+chmin+chmax, cpus)
>cpus.ltr
>summary(cpus.ltr)



This page is powered by Blogger. Isn't yours?