[[アクセスラインキング]]

#contents

2011/07/20からのアクセス回数 &counter;

** ChasenからMeCabへ [#u8e751ac]
集合知の3章をおさらいしたときには、Chasenを使ったのですが、MeCabの方がよいとの情報を得て、
Sageで「集合知の3章図3.3を再現する」記事のために、MeCabとmecab-python、おまけにfeedparser
をSageにインストールしました。

忘備録として、MeCabのインストール手順を書き留めておきます。

** MeCabのインストール [#w60d53fa]
以下の手順は、MacOSX(Linon)、CentOS 5.7(さくらVPS)で試しています。

MeCabのソースと展開ディレクトリは、~/localで実行しました。

#pre{{
$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz 
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install
}}


** 辞書のインストール [#ma75c730]
辞書の作成でmecabのライブラリを使用するため、LD_LIBRARY_PATHに/usr/local/libを追加
します。

.bash_profileに以下の2行を追加してください。

#pre{{
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
export LD_LIBRARY_PATH
}}

辞書のダウンロードとインストールは以下の手順で行います。
#pre{{
$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz 
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install
}}

** MeCab単体での動作確認 [#a85bcbfc]
これで、MeCabが動くようになりましたので、先に進む前に動作を確認しておきます。

「これはテストです。」と改行を入力した後に、Ctrl-Dを入力すると以下のように出力されます。
#pre{{
$ mecab
これはテストです。
これ	名詞,代名詞,一般,*,*,*,これ,コレ,コレ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
テスト	名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。	記号,句点,*,*,*,*,。,。,。
EOS
}}

** python-mecabのインストール [#zb5a3b08]
Sageで使えるようにpython-mecabをSageにインストールします。

以下、Sageのインストールディレクトリを/usr/local/sageと説明しますので、適宜読み替えてください。

Sageにpython用パッケージをインストールする場合には、sageを-pythonオプションで起動します。

以下にpython-mecabのインストール手順を示します。
#pre{{
$ wget http://sourceforge.net/projects/mecab/files/mecab-python/0.98/mecab-python-0.98.tar.gz
$ tar xzvf mecab-python-0.98.tar.gz 
$ cd mecab-python-0.98
$ /usr/local/sage/sage -python setup.py build
$ /usr/local/sage/sage -python setup.py install
}}

*** Sageでの動作確認 [#dcd3c445]
sageでの動作確認は、次のように行います。

ワークシートで以下のように入力すると、
#pre{{
import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print m.parse ("これはテストです。")
}}
以下のような結果が表示されれば、完成です。
#pre{{
これ	コレ	これ	名詞-代名詞-一般		
は	ハ	は	助詞-係助詞		
テスト	テスト	テスト	名詞-サ変接続		
です	デス	です	助動詞	特殊・デス	基本形
。	。	。	記号-句点		
EOS
}}


** おまけ [#d1953e52]
ついでにfeedparserもインストールします。

pthon-mecabと同様に以下のように行います。

#pre{{
$ wget http://feedparser.googlecode.com/files/feedparser-5.1.2.tar.gz
$ tar xzvf feedparser-5.1.2.tar.gz 
$ cd feedparser-5.1.2
$ /usr/local/sage/sage -python setup.py install
}}

** コメント [#t4349ede]
#vote(おもしろかった[3],そうでもない[0],わかりずらい[3])
#vote(おもしろかった[4],そうでもない[0],わかりずらい[3])

皆様のご意見、ご希望をお待ちしております。
#comment_kcaptcha

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
SmartDoc