CentOsにTritonnをインストールして形態素解析をしましょう。

一般的に形態素解析をしようとすると、以下のものが必要なようです。


MeCab
http://mecab.sourceforge.net/
senna
http://qwik.jp/senna/install.html
Tritonn
http://qwik.jp/tritonn/


MeCabのインストールには、
MeCab本体と辞書を加えてインストールする必要があります。

今回は文字コードutf-8にしますので、
configureの際にちょっと注意が必要です。

MeCabのインストール

% tar zxfv mecab-X.X.tar.gz
% cd mecab-X.X
% ./configure --prefix=/usr --with-charset=utf8
% make
% make check
% su
# make install


辞書のインストール

% tar zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
% mecab-ipadic-2.7.0-XXXX
% ./configure --prefix=/usr --enable-utf8-only
% make
% su
# make install

もしもうまくutf-8で辞書が構築できなかった場合、
makeの後に以下のコマンドを実行することでうまくいきました。
詳しくはこちら。
http://risky.cs.inf.shizuoka.ac.jp/~noguchi/index.php?tips%2Fmecab


% mecab-dict-index -t utf-8
% tar zcvf ipadic-utf8.tar.gz *.csv *.bin *.dec *.dic dicrc


sennaは普通にインストールしてok。

> svn co http://svn.razil.jp/senna/trunk senna
> cd senna
> ./configure --prefix=/usr
> make
> sudo make install


Tritonnのインストールはこちらが詳しいです。
http://wiki.minaco.net/index.php?VMwareFusion%2FCentOS5%2F11.MySQL%2BTritonnインストール#x4bb88af


追記:
成果物公開しました。
芸能人ブログで紹介されている商品が検索できるサイト。
セレブログ