2010年1月6日水曜日

Mahoutを試してみた

スズキです。

Hadoopも利用出来るようになったので、
http://blog.suz-lab.com/2010/01/machadoopmap-reduce.html
次はMahoutです。
http://lucene.apache.org/mahout/

MahoutはHadoopを利用した機械学習ライブラリです。
機械学習とは… 下記を参考にして下さい…
http://ja.wikipedia.org/wiki/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92

まず、MahoutをビルドするためにMavenをインストールする必要があります。
(環境は引き続きMacです)

(1) Mavenの入手

下記より、apache-maven-x.x.x-bin.zipを入手して、
適当なフォルダ(MAVEN_HOME)に展開します。
http://maven.apache.org/download.html

(2) 環境変数の設定

MavenのパスとJAVA_HOMEを設定します。
(下記は.profileに書くとしたら、です)

--------【.profile】--------
MAVEN_HOME=/Users/suzuki/Dropbox/suz-lab/common/sbin/maven
HADOOP_HOME=/Users/suzuki/Dropbox/suz-lab/common/sbin/hadoop
export PATH=/opt/local/bin:/opt/local/sbin:$PATH
export PATH=$MAVEN_HOME/bin:$PATH
export PATH=$HADOOP_HOME/bin:$PATH
export JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6.0/Home
--------
※ Hadoopの設定も入ってます。

Mavenの用意ができたら、いよいよMahoutです。

(3) Mahoutの入手

下記より、mahout-x.x-project.zipを入手して、適当なフォルダに展開します。
http://ftp.kddilabs.jp/infosystems/apache/lucene/mahout/

(4) Mahoutのビルド

展開したフォルダ直下で"mvn install"を実行してビルドします。
(少し時間がかかります)

(5) Mahout(サンプル)の実行

まず"$MAHOUT_HOME/examples/target"に"testdata"フォルダを作成し、
データを用意します。

データは下記よりダウンロードします。
http://kdd.ics.uci.edu/databases/synthetic_control/synthetic_control.data

次に"$MAHOUT_HOME/examples/target"直下で下記コマンドを実行します。

hadoop jar mahout-examples-x.x.job
org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

するとコンソールに、それらしいログがいろいろと出力されます。

そもそも、機械学習を勉強しなくては…

--------
http://www.suz-lab.com

0 コメント: