主にプログラミング関連のメモ帳 ♪(✿╹ヮ╹)ノ
書いてあるコードは自己責任でご自由にどうぞ。記事本文の無断転載は禁止です。
2016/09/20
ちょっと MeCab とかで遊びたくなったので、インストールとかのメモ。
基本的には、各ドキュメントにあるインストール方法そのままだったりします。
まぁ、公式サイト通りに。
$ wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE" -o mecab-0.996.tar.gz
$ tar zxfv mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure
$ make
$ make check
$ sudo make install
推奨されている、 IPA 辞書をインストールします。
ただ、 configure するときに、 --with-charset=utf8
を指定しないと文字化けするので注意。
$ wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM" -o mecab-ipadic-2.7.0-20070801.tar.gz
$ tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install
あと、新語に対応した NEologd もインストールしておきます。
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
CRF++ が必要なので、まずはそれから。
$ wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7QVR6VXJ5dWExSTQ" -O CRF++-0.58.tar.gz
$ tar zxfv CRF++-0.58.tar.gz
$ cd CRF++-0.58
$ ./configure
$ make
$ sudo make install
で、 CaboCha。
こちらも、 --with-charset=utf8
を忘れずに。
$ wget "https://googledrive.com/host/0B4y35FiV1wh7cGRCUUJHVTNJRnM/cabocha-0.69.tar.bz2" -O cabocha-0.69.tar.bz2
$ tar jxvf cabocha-0.69.tar.bz2
$ cd cabocha-0.69
$ ./configure --with-charset=utf8
$ make
$ sudo make install
これで、インストールは完了。
使うときはこんな感じ。
$ cabocha -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
10日放送の「中居正広のミになる図書館」(テレビ朝日系)で、SMAPの中居正広が、篠原信一の過去の勘違いを明かす一幕があった。
10日放送の-D
「中居正広のミになる図書館」-D
(テレビ朝日系)で、---------------D
SMAPの-D |
中居正広が、-----------D
篠原信一の---D |
過去の-D |
勘違いを-D |
明かす-D |
一幕が-D
あった。
EOS
おわり。