nFact

n!

MeCabを使う

Twitterbotを作ろうと形態素解析Mecabを使ったら

微妙にハマったのでメモ。
大部分をさたなべさん教えてもらいました。ありがとうございます。

brewが入ってなかったらまずbrewをインストール。
brew searchすると

noko-Air% brew search mecab  
mecab       mecab-ipadic  
noko-Air%

みたいに2つ出てきます。ここで、

brew install mecab  

だけで使うと、辞書ファイルが無いので動きません。なので

brew install mecab-ipadic  

もする必要があります。
これで使えるようになったので、

noko-Air% mecab  
今夜はラーメンを食べに行こう   
今夜  名詞,副詞可能,*,*,*,*,今夜,コンヤ,コンヤ  
は 助詞,係助詞,*,*,*,*,は,ハ,ワ  
ラーメン    名詞,一般,*,*,*,*,ラーメン,ラーメン,ラーメン  
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ  
食べ  動詞,自立,*,*,一段,連用形,食べる,タベ,タベ  
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ  
行こ  動詞,自立,*,*,五段・カ行促音便,未然ウ接続,行く,イコ,イコ  
う 助動詞,*,*,*,不変化型,基本形,う,ウ,ウ  
EOS  

これで形態素解析が使えるようになりました。 Javaで使う場合は、
https://code.google.com/p/cmecab-java/cmecabを落として、
ビルドパス上のディレクトリに中身のlibごとjarを突っ込んだ後、

/usr/local/libEclipseのネイティブライブラリーのロケーションとして指定すると
OutOfMemoryとかで落ちなくなります。

考えてみればまあ当たり前なんですが辞書が無くてなかなか動かなかったorz

広告を非表示にする