アクセスラインキング?

2011/07/20からのアクセス回数 4427

ChasenからMeCabへ

集合知の3章をおさらいしたときには、Chasenを使ったのですが、MeCabの方がよいとの情報を得て、 Sageで「集合知の3章図3.3を再現する」記事のために、MeCabとmecab-python、おまけにfeedparser をSageにインストールしました。

忘備録として、MeCabのインストール手順を書き留めておきます。

MeCabのインストール

以下の手順は、MacOSX(Linon)、CentOS 5.7(さくらVPS)で試しています。

MeCabのソースと展開ディレクトリは、~/localで実行しました。

$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz 
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install

辞書のインストール

辞書の作成でmecabのライブラリを使用するため、LD_LIBRARY_PATHに/usr/local/libを追加 します。

.bash_profileに以下の2行を追加してください。

LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
export LD_LIBRARY_PATH

辞書のダウンロードとインストールは以下の手順で行います。

$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz 
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install

MeCab単体での動作確認

これで、MeCabが動くようになりましたので、先に進む前に動作を確認しておきます。

「これはテストです。」と改行を入力した後に、Ctrl-Dを入力すると以下のように出力されます。

$ mecab
これはテストです。
これ	名詞,代名詞,一般,*,*,*,これ,コレ,コレ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
テスト	名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。	記号,句点,*,*,*,*,。,。,。
EOS

python-mecabのインストール

Sageで使えるようにpython-mecabをSageにインストールします。

以下、Sageのインストールディレクトリを/usr/local/sageと説明しますので、適宜読み替えてください。

Sageにpython用パッケージをインストールする場合には、sageを-pythonオプションで起動します。

以下にpython-mecabのインストール手順を示します。

$ wget http://sourceforge.net/projects/mecab/files/mecab-python/0.98/mecab-python-0.98.tar.gz
$ tar xzvf mecab-python-0.98.tar.gz 
$ cd mecab-python-0.98
$ /usr/local/sage/sage -python setup.py build
$ /usr/local/sage/sage -python setup.py install

Sageでの動作確認

sageでの動作確認は、次のように行います。

ワークシートで以下のように入力すると、

import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print m.parse ("これはテストです。")

以下のような結果が表示されれば、完成です。

これ	コレ	これ	名詞-代名詞-一般		
は	ハ	は	助詞-係助詞		
テスト	テスト	テスト	名詞-サ変接続		
です	デス	です	助動詞	特殊・デス	基本形
。	。	。	記号-句点		
EOS

おまけ

ついでにfeedparserもインストールします。

pthon-mecabと同様に以下のように行います。

$ wget http://feedparser.googlecode.com/files/feedparser-5.1.2.tar.gz
$ tar xzvf feedparser-5.1.2.tar.gz 
$ cd feedparser-5.1.2
$ /usr/local/sage/sage -python setup.py install

コメント

選択肢 投票
おもしろかった 4  
そうでもない 0  
わかりずらい 3  

皆様のご意見、ご希望をお待ちしております。


(Input image string)


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2014-10-15 (水) 18:27:42 (3478d)
SmartDoc