2018/05/30
ubuntuにMeCabをインストールする
日々利用しているHPノートPC(Windows10)にubuntuのデュアルブートの環境を構築しました。あまりにもWindows10環境は使いにくく、動作も遅いのでストレスが溜まりまくっていました。いつも利用するR、R Studio、Visual Studio codeもインストールし、環境としては問題なく、サクサクとPCを利用できるようになりました。以前お話した「テキストマイニング」の勉強のために、今回はこのubuntuの環境に、MeCab(RMeCab)をインストールしました。その備忘録です。
まずはMeCabのインストールです。このサイトにubuntuへのインストール手順が書かれてあるので、それを実行しました。
drbobt@ubuntu:~$ sudo apt-get install libmecab1 libmecab-dev mecab mecab-ipadic mecab-ipadic-utf8 mecab-utils
パッケージリストを読み込んでいます... 完了エラーを吐かれてしまいました。libmecab1ではなく、最新はlibmecab2のようです。仕切り直して実行。
依存関係ツリーを作成しています
状態情報を読み取っています... 完了
パッケージ libmecab1 は使用できませんが、別のパッケージから参照されます。
これは、パッケージが欠落しているか、廃止されたか、または別のソース
からのみ利用可能であることを意味します。
しかし、以下のパッケージが置き換えます:
libmecab2:i386 libmecab2
E: パッケージ 'libmecab1' にはインストール候補がありません
drbobt@ubuntu:~$ sudo apt-get install libmecab2 libmecab-dev mecab mecab-ipadic mecab-ipadic-utf8 mecab-utils
パッケージリストを読み込んでいます... 完了今度はうまく行きました。
依存関係ツリーを作成しています
状態情報を読み取っています... 完了
以下のパッケージが新たにインストールされます:
libmecab-dev libmecab2 mecab mecab-ipadic mecab-ipadic-utf8 mecab-utils
アップグレード: 0 個、新規インストール: 6 個、削除: 0 個、保留: 0 個。
12.8 MB のアーカイブを取得する必要があります。
この操作後に追加で 60.4 MB のディスク容量が消費されます。
取得:1 http://jp.archive.ubuntu.com/ubuntu bionic/universe amd64 libmecab2 amd64 0.996-5 [257 kB]
・・・
・・・
reading /usr/share/mecab/dic/ipadic/matrix.def ... 1316x1316
emitting matrix : 100% |###########################################|
done!
次に、R Studioを起動させ、RMeCabをインストールします。このサイトにRMeCabのインストール手順が書かれてあるので、それを実行しました。
install.packages("RMeCab", repos = "http://rmecab.jp/R", type = "source")これは問題なくすんなりとインストールできました。早速、動作確認です。
動作も問題ないようです。今後、いろいろ遊んでみようと思います。
> library(RMeCab)
> res <- RMeCabC("すもももももももものうち")
> unlist(res)
名詞 助詞 名詞 助詞 名詞 助詞 名詞
"すもも" "も" "もも" "も" "もも" "の" "うち"
>