このブログを検索

2013/02/22

mecabの辞書登録

登録する単語を記述したcsvファイルをIPA辞書の配下に置く。
mecabをインストールするときに辞書をutf-8にしたはずだが、
ここに置くときはeucにしないとダメだった。

$ cp mydic.csv mecab-ipadic-2.7.0-20070801/
$ cd mecab-ipadic-2.7.0-20070801


初めて登録するときは、configureとmakeをする

$ ./configure --with-charset=utf8
$ make
$ sudo make install


2回目以降はmake cleanとmakeをする

$ make clean
$ make
$ sudo make install


(参考)

http://www.mwsoft.jp/programming/nlp/mecab_dictionary_customize.html