読者です 読者をやめる 読者になる 読者になる

アプリとサービスのすすめ

アプリやIT系のサービスを中心に書いていきます。たまに副業やビジネス関係の情報なども気ままにつづります

anacondaのJupyterでmecabをインストールする方法【Mac】

Mecabとは
mecab形態素解析ツールで文章を単語に分けてくれるツールです。ナイーブベイズ分類器というメールのスパム判定などに用いる機械学習のシステムの学習によく使うと思います。
使用環境
Mac book air
・anaconda

の使用環境で使ってインストールしてみました。Qiitaとかで結構のってるんですが、断片的だったり、anacondaに対応してないサイトもあったり、情報としてまとまってないので、anacondaで使用する方法としてしっかりまとめておこうと思います。

mecabのインストール方法

anacondaのインストール

まず、anacondaのインストールはどこにでも載ってるので、ほぼ割愛。

公式サイトからWindows用か、Mac用に合わせてインストールすればOK。



HomebrewをMacにインストール

mecabをインストールする際にHomebrewというのをMacに読み込ませました。

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)

まずこれをインストールしないと、mecabは動作しない。Macのターミナルに公式サイトに掲載されているコマンドをコピペすればインストールができます。
ここら辺はサイトの通り。



anaconda内で仮想環境を作成

anacondaを起動した画面から「Environment」を押して、下の画像のように「create」を押す。今回はmecab用の仮想環境を作ってみました。
f:id:trafalbad:20170429181559j:plain
名前は好きに決めてOK。完成したボタンの右の矢印を押すとターミナルを開けます。



mecabとIP辞書のコマンドをターミナルに実装する

ターミナルが開けたら、mecabと辞書をインストールします

このコマンドでまずmecabをインストール

brew install mecab

次にこのコマンドで辞書をインストールします。

brew install mecab-ipadic

順にターミナルに実装していって下さい。



ライブラリにnatto-pyがインストールされているか確認する

anacondaではnatto-pyのライブラリを使いました。


下記画像の「not installed」を押してインストールされていないライブラリ項目にnatto-pyがあれば、まだインストールされてないので、インストールします。
f:id:trafalbad:20170429181620j:plain


mecabを試してみる


下記コマンドで正常に動くかどうか確認できます。

from natto import MeCab

nm = MeCab()
print(nm.parse('すもももももももものうち'))

>>>
もも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ



anacondaのアクセス権限の影響でmecabがインストールできないとき
すでに別のmecabをインストールしてしまった場合、新しいバージョンをインストールできない場合があります。そんなときはすでにインストール済みのものをアンイストールします。

例えば今回のmecabをインストールしたい場合は
mecabをアンイストール

brew uninstall mecab

辞書をアンイストール

brew uninstall mecab-ipadic

してから再度下記コマンドをターミナルに再び実装するとインストールできます。

brew install mecab
brew install mecab-ipadic

これでmecabがanacondaでも使えるようになります。mecabでは分かち書きなどいろんな出力方法があるので便利。

広告を非表示にする