[[アクセスラインキング]] #contents 2011/07/20からのアクセス回数 &counter; ** ChasenからMeCabへ [#u8e751ac] 集合知の3章をおさらいしたときには、Chasenを使ったのですが、MeCabの方がよいとの情報を得て、 Sageで「集合知の3章図3.3を再現する」記事のために、MeCabとmecab-python、おまけにfeedparser をSageにインストールしました。 忘備録として、MeCabのインストール手順を書き留めておきます。 ** MeCabのインストール [#w60d53fa] 以下の手順は、MacOSX(Linon)、CentOS 5.7(さくらVPS)で試しています。 MeCabのソースと展開ディレクトリは、~/localで実行しました。 #pre{{ $ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --with-charset=utf8 $ make $ sudo make install }} ** 辞書のインストール [#ma75c730] 辞書の作成でmecabのライブラリを使用するため、LD_LIBRARY_PATHに/usr/local/libを追加 します。 .bash_profileに以下の2行を追加してください。 #pre{{ LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib export LD_LIBRARY_PATH }} 辞書のダウンロードとインストールは以下の手順で行います。 #pre{{ $ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz $ cd mecab-ipadic-2.7.0-20070801 $ ./configure --with-charset=utf8 $ make $ sudo make install }} ** MeCab単体での動作確認 [#a85bcbfc] これで、MeCabが動くようになりましたので、先に進む前に動作を確認しておきます。 「これはテストです。」と改行を入力した後に、Ctrl-Dを入力すると以下のように出力されます。 #pre{{ $ mecab これはテストです。 これ 名詞,代名詞,一般,*,*,*,これ,コレ,コレ は 助詞,係助詞,*,*,*,*,は,ハ,ワ テスト 名詞,サ変接続,*,*,*,*,テスト,テスト,テスト です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス 。 記号,句点,*,*,*,*,。,。,。 EOS }} ** python-mecabのインストール [#zb5a3b08] Sageで使えるようにpython-mecabをSageにインストールします。 以下、Sageのインストールディレクトリを/usr/local/sageと説明しますので、適宜読み替えてください。 Sageにpython用パッケージをインストールする場合には、sageを-pythonオプションで起動します。 以下にpython-mecabのインストール手順を示します。 #pre{{ $ wget http://sourceforge.net/projects/mecab/files/mecab-python/0.98/mecab-python-0.98.tar.gz $ tar xzvf mecab-python-0.98.tar.gz $ cd mecab-python-0.98 $ /usr/local/sage/sage -python setup.py build $ /usr/local/sage/sage -python setup.py install }} *** Sageでの動作確認 [#dcd3c445] sageでの動作確認は、次のように行います。 ワークシートで以下のように入力すると、 #pre{{ import sys import MeCab m = MeCab.Tagger ("-Ochasen") print m.parse ("これはテストです。") }} 以下のような結果が表示されれば、完成です。 #pre{{ これ コレ これ 名詞-代名詞-一般 は ハ は 助詞-係助詞 テスト テスト テスト 名詞-サ変接続 です デス です 助動詞 特殊・デス 基本形 。 。 。 記号-句点 EOS }} ** おまけ [#d1953e52] ついでにfeedparserもインストールします。 pthon-mecabと同様に以下のように行います。 #pre{{ $ wget http://feedparser.googlecode.com/files/feedparser-5.1.2.tar.gz $ tar xzvf feedparser-5.1.2.tar.gz $ cd feedparser-5.1.2 $ /usr/local/sage/sage -python setup.py install }} ** コメント [#t4349ede] #vote(おもしろかった[3],そうでもない[0],わかりずらい[3]) #vote(おもしろかった[4],そうでもない[0],わかりずらい[3]) 皆様のご意見、ご希望をお待ちしております。 #comment_kcaptcha