CentOsにTritonnをインストールして形態素解析をしましょう。
一般的に形態素解析をしようとすると、以下のものが必要なようです。
・MeCab
http://mecab.sourceforge.net/
・senna
http://qwik.jp/senna/install.html
・Tritonn
http://qwik.jp/tritonn/
MeCabのインストールには、
MeCab本体と辞書を加えてインストールする必要があります。
今回は文字コードをutf-8にしますので、
configureの際にちょっと注意が必要です。
MeCabのインストール
% tar zxfv mecab-X.X.tar.gz
% cd mecab-X.X
% ./configure --prefix=/usr --with-charset=utf8
% make
% make check
% su
# make install
辞書のインストール
% tar zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
% mecab-ipadic-2.7.0-XXXX
% ./configure --prefix=/usr --enable-utf8-only
% make
% su
# make install
もしもうまくutf-8で辞書が構築できなかった場合、
makeの後に以下のコマンドを実行することでうまくいきました。
詳しくはこちら。
http://risky.cs.inf.shizuoka.ac.jp/~noguchi/index.php?tips%2Fmecab
% mecab-dict-index -t utf-8
% tar zcvf ipadic-utf8.tar.gz *.csv *.bin *.dec *.dic dicrc
sennaは普通にインストールしてok。
> svn co http://svn.razil.jp/senna/trunk senna
> cd senna
> ./configure --prefix=/usr
> make
> sudo make install
Tritonnのインストールはこちらが詳しいです。
http://wiki.minaco.net/index.php?VMwareFusion%2FCentOS5%2F11.MySQL%2BTritonnインストール#x4bb88af