MUSASHIのインストール
MUSASHIというのはMining Utilities and System Architecture for Scalable processing of HIstorical dataの略。
データマイニングの定番ツールといったところ。
まず、unixのコマンドを Windows 上で実行可能にする環境である cygwin をダウンロード。
cygwin 自体のセットアップの方法に関しては 早田恭彦さんのページが参考になる。
そして、MUSASHIをダウンロード。
cygwin を起動して。
> tar zxvf musashi-core-1.0.3.tar.gz
SJIS環境で利用する場合は、setdocenc.sh を開いて
# Encoding for command help message (-h)
#helpEnc=ja-euc
helpEnc=ja-sjis
#helpEnc=ja-utf8
#helpEnc=en
# Default encoding for XML document
#xmlEnc=euc-jp
xmlEnc=Shift_JIS
#xmlEnc=UTF-8
とした上で、
> cd musashi
> ./configure
とするとmakefileの設定を行ってくれる。
> make
> make install
でインストールの完了。
実際にビジネスデータを解析に掛ける前にコマンドを色々と試してみたいという場合には、顧客購買履歴の人工データがある。
また、MUSASHIでテキストマイニングを行う場合は musashi_text というGUIベースのツールがある。
また、MUSASHIで解析した結果をWEKAで表示させると見やすい。
MUSASHIの入門に関しては鶴田展之氏による非常に分かりやすい解説がある。
データマイニングの定番ツールといったところ。
まず、unixのコマンドを Windows 上で実行可能にする環境である cygwin をダウンロード。
cygwin 自体のセットアップの方法に関しては 早田恭彦さんのページが参考になる。
そして、MUSASHIをダウンロード。
cygwin を起動して。
> tar zxvf musashi-core-1.0.3.tar.gz
SJIS環境で利用する場合は、setdocenc.sh を開いて
# Encoding for command help message (-h)
#helpEnc=ja-euc
helpEnc=ja-sjis
#helpEnc=ja-utf8
#helpEnc=en
# Default encoding for XML document
#xmlEnc=euc-jp
xmlEnc=Shift_JIS
#xmlEnc=UTF-8
とした上で、
> cd musashi
> ./configure
とするとmakefileの設定を行ってくれる。
> make
> make install
でインストールの完了。
実際にビジネスデータを解析に掛ける前にコマンドを色々と試してみたいという場合には、顧客購買履歴の人工データがある。
また、MUSASHIでテキストマイニングを行う場合は musashi_text というGUIベースのツールがある。
また、MUSASHIで解析した結果をWEKAで表示させると見やすい。
MUSASHIの入門に関しては鶴田展之氏による非常に分かりやすい解説がある。