fc2ブログ

ubuntuにMeCabをインストールする

 日々利用しているHPノートPC(Windows10)にubuntuのデュアルブートの環境を構築しました。あまりにもWindows10環境は使いにくく、動作も遅いのでストレスが溜まりまくっていました。いつも利用するRR Studio、Visual Studio codeもインストールし、環境としては問題なく、サクサクとPCを利用できるようになりました。

 以前お話した「テキストマイニング」の勉強のために、今回はこのubuntuの環境に、MeCab(RMeCab)をインストールしました。その備忘録です。

 まずはMeCabのインストールです。このサイトにubuntuへのインストール手順が書かれてあるので、それを実行しました。
drbobt@ubuntu:~$ sudo apt-get install libmecab1 libmecab-dev mecab mecab-ipadic mecab-ipadic-utf8 mecab-utils
パッケージリストを読み込んでいます... 完了
依存関係ツリーを作成しています
状態情報を読み取っています... 完了
パッケージ libmecab1 は使用できませんが、別のパッケージから参照されます。
これは、パッケージが欠落しているか、廃止されたか、または別のソース
からのみ利用可能であることを意味します。
しかし、以下のパッケージが置き換えます:
libmecab2:i386 libmecab2

E: パッケージ 'libmecab1' にはインストール候補がありません
エラーを吐かれてしまいました。libmecab1ではなく、最新はlibmecab2のようです。仕切り直して実行。
drbobt@ubuntu:~$ sudo apt-get install libmecab2 libmecab-dev mecab mecab-ipadic mecab-ipadic-utf8 mecab-utils
パッケージリストを読み込んでいます... 完了
依存関係ツリーを作成しています
状態情報を読み取っています... 完了
以下のパッケージが新たにインストールされます:
libmecab-dev libmecab2 mecab mecab-ipadic mecab-ipadic-utf8 mecab-utils
アップグレード: 0 個、新規インストール: 6 個、削除: 0 個、保留: 0 個。
12.8 MB のアーカイブを取得する必要があります。
この操作後に追加で 60.4 MB のディスク容量が消費されます。
取得:1 http://jp.archive.ubuntu.com/ubuntu bionic/universe amd64 libmecab2 amd64 0.996-5 [257 kB]
・・・
・・・
reading /usr/share/mecab/dic/ipadic/matrix.def ... 1316x1316
emitting matrix : 100% |###########################################|

done!
今度はうまく行きました。

 次に、R Studioを起動させ、RMeCabをインストールします。このサイトにRMeCabのインストール手順が書かれてあるので、それを実行しました。
install.packages("RMeCab", repos = "http://rmecab.jp/R", type = "source") 
これは問題なくすんなりとインストールできました。早速、動作確認です。

> library(RMeCab)
> res <- RMeCabC("すもももももももものうち")
> unlist(res)
名詞 助詞 名詞 助詞 名詞 助詞 名詞
"すもも" "も" "もも" "も" "もも" "の" "うち"
>
動作も問題ないようです。今後、いろいろ遊んでみようと思います。
スポンサーサイト



Windows10 PCでubuntuをデュアルブートする(2)

 前回の続きです。セットアップディスクとインストール先(Windows10のHDD)のパーティションも準備できましたので、インストール作業からスタートです。

3. インストール
 ubuntuのインストール方法は、Macの時と同様の方法で行いました。
① USBメモリ(セットアップディスク)をPCに挿して、PCを再起動させると、ubuntuのGUIが立ち上がります。デスクトップ上の「Install Ubuntu 18.04LTS」アイコンをダブルクリックするとインストールが始まります。ubuntu_install1_180529.png② 「日本語」を選んで「続ける」をクリックします。ubuntu_install2_180529.png③ キーボードレイアウトも「日本語」を選んで「続ける」をクリックします。ubuntu_install3_180529.png④ 「通常のインストール」を選択し、「Ubuntuのインストール中にアップデートをダウンロードする」にチェックを入れて、「続ける」をクリックします。ubuntu_install4_180529.png⑤ インストールの種類は「それ以外」を選択し「続ける」をクリックします。ubuntu_install5_180529.png⑥ ubuntuをインストールする「空き領域」が確認できましたので、「+ボタン」を押して、ext4とswap領域を作成します。ubuntu_install6_180529.png⑦ ubuntuの本体が入るext4に54GB、swapに10GBを確保しました。ubuntu_install7_180529.png以後、メッセージに従ってインストールを進め、無事に完了できました。

 ①のUSBメモリ(セットアップディスク)を抜いて、再起動させて、ubuntuが起動するのを待ちます。しかし、なぜかWindows10が立ち上がる・・。何度やってもWindows10が起動してしまいます・・。ネットでいろいろ調べているうちにWindowsの「電源オプション」の「システム設定」で「高速スタートアップを有効にする(推奨)」のチェックを外したり、Windows電源オプション_180529BIOSの「OS boot Manager」の優先順位を変更する必要があることが分かりました。ubuntu_install8_180529.png
 変更後、PCを起動させると「Boot Menu」が表示されました。ubuntu_run_180529.pngデフォルトがubuntuだったので、そのまま起動させると、無事にubuntuが起動しました。壁紙もシンプルに変更しました。ubuntu起動画面_180529起動もWindows10よりも速く、起動後もサクサクと動きます。なかなかいい感じです。

 難儀したのは一点、ubuntu起動後にネットワーク接続異常が発生しました。有線LAN接続だったのですが、ubuntuで接続できていた状態で、Windows10でブートし直すと、LAN接続ができなくなる。再度、ubuntuでブートし直すと、今度はubuntuの方もLAN接続できなくなる状況に陥りました。
 結局、Windows側のネットワーク設定において、ubuntuセットアップ後に「IPv6のチェックが入っていたこと」と「固定IPを使っていたこと」が悪さをしていたようです。windowsネットワーク設定_180529対策後は、問題なく、ubuntu/windows10ともに有線LAN接続できるようになりました。
 快適に使える環境構築ができましたが、唯一の難点は、ubuntuを使った後にWindowsを起動させると、必ず表示時刻がグリニッジ時刻になっていることです。鬱陶しいですが、マイ○ソソフトなのであきらめています・・。

 最後にインストール後のパーティションをubuntu/windowsの双方から確認しました。Partition_ubuntu_180529.pngPartition_windows_180529.png双方とも問題なさそうです。

 動作が遅くストレスを感じていたHPのノートPCですが、ubuntuで息を吹き返しました。今後はこちらをメインで使って行こうと思います。Windowsはマシンのハードスペックがそれなりに要求され、かつ、そもそも重たいOSなので(レジストリも個人的に嫌い・・)、今後ますます使いたくないですね。結局、愚痴に始まり、愚痴で終わってしまいました・・。すみません・・。

Windows10 PCでubuntuをデュアルブートする(1)

 昨年4月に購入したHPのノートPC(Windows10 Home)のことです。このPCは購入してようやく1年経ちましたが、本当に「ケチばかりつくパソコン」なんです。何といっても「遅い、遅い、遅い」の三拍子で、使うたびにイライラしてしまいます。購入後、いらないHP関連のアプリを全削除し、スッキリしたのも束の間、通り魔のようにやってくるマイ○ソソフトのWindows Updateが終わるとさらに遅くなっている・・。身にしみて良く分かります。

問題のPCのスペックは以下の通り。
 CPU: Core i3-6100 CPU @ 2.3GHz
 メモリ: 4GB
 HDD: 500GB
せめて、Core i5でSSDにしておけば、こんなストレスもなかったのになぁと思う毎日・・。

 PC起動時にいつもHDDがディスクアクセスで、ひたすらカリカリ、カリカリ言っており、タスクマネージャで確認してもいつもディスクアクティブ時間が100%のまま・・。起動数分後、一旦収まるのですが、また意味不明なディスクアクセスが・・・。キーボードで文字入力しようにも固まっていて入力文字がリアルタイムに反映されない。忘れた頃に以前に入力した文字が時間差で出てくる・・。あ〜ぁ、やっぱりWindowsって、最近(数年前ぐらいから)使えないな、マイ○ソソフトもユーザに対し、手を抜いているのではないかと思うほど・・。
 会社でもWindowsを使っていますが、この自宅のHPノートよりはスペックが良く、速いのでそれほどストレスは感じていません。やはり、PC購入時にケチってはいけませんね。少し無理してでもいいものを買わなくてはダメですね(教訓)。

 愚痴はこれぐらいにして、この遅い遅いHPノートPCを無駄にしないように、ubuntuでも入れてデュアルブートさせ、ubuntuをメインで使って行けばストレスも軽減するんじゃないか?と思い立ちました。

 ubuntuは過去に、Macで外付けSSDから起動させたり、Windows10からDocker Toolboxを使って起動させたり、最近(Windows10 Fall Creators Update以降)のWindows10では普通に「Bash on Ubuntu on Windows」でubuntuが動く状況になっているので使っています。
 しかし、結局、WindowsからDockerや、Bash on Ubuntuを呼び出しても、Windows自身が元から遅いので、良いことはありませんね。やはりサクサク動かなくては精神衛生上、意味がないです・・。

 そう言うわけで、結局、クリーンインストールして、デュアルブートするのが一番良いのではないかと結論が出ました。

 以下、デュアルブートへの道筋をお話しします。まず、デュアルブートのセットアップ前には、PCが動かなくなるなどの最悪な状態を想定し、元に戻せるように「バックアップ」を取りました。以前、Windows Updateでおかしくなったこともありましたので、定期的なバックアップは必須ですね。

バックアップ後のセットアップは、以下の流れです。
 1. セットアップディスクの準備
 2. インストール先のパーティションを準備
 3. インストール
 4. 動作確認
順を追って説明します。

1.セットアップディスクの準備
 このサイトからubuntu 18.04 LTSをダウンロードしました。ubuntu_install_ready1_180527.pngubuntu_install_ready2_180527.png
 次に、インストールディスクを作成するために、USBメモリ(Transcend JetFlash JF V33/8GB)を準備しました。Macの時はインストールディスク(USB)を作成するのに苦労しましたが、Windowsは「Rufus」というソフトを使って、簡単にできました。
 インストール用のUSBメモリをPCに挿入して、Rufusを起動させます。①ファイルシステム:FAT32(デフォルト)を確認した上で、②ISOイメージを選択し、③ISOファイルを読み込みます。④読み込まれると、「新しいボリュームのラベル」に書き込むISOファイルが設定されます。その状態で⑤スタートボタンを押すと書き込みが始まります。ubuntu_install_ready3_180527.pngその後、何度かコメントウィンドウが表示されますが、はい/OKで進み、問題なく書き込みが完了しました。ubuntu_install_ready4_180527.pngubuntu_install_ready5_180527.pngubuntu_install_ready6_180527.png
2. インストール先のパーティションを準備
 インストール先は外付けのSSDでも良かったのですが、ネット記事を見ていると、うまく行かなかった例が「ちらほら」あったので、止めることにしました。結局、HPノートPCをubuntuマシンにするつもりなので、HPノートのHDDをインストール先に設定しました。

Windowsの「管理ツール」を開き、「コンピュータの管理」を選択します。windows_partition1_180527.pngノートPCのHDDは500GBの東芝製(これからどうなる・・)です。中身をのぞいてみると、260MBのブート領域、WindowsのCドライブや、HPならではのRecovery用のDドライブがあります(これも鬱陶しいですね・・)。よく見ると、980MBの正常(回復パーティション)なるものもあります。Windows Updateの残骸のようです・・(勝手に作ってそのままなんだろうな・・)。windows_partition2_180527.png
 今回、ubuntuをインストールするのは、Windows(cドライブ)の領域を「64GB」いただくことにします。「ボリュームの縮小」で容量を設定すると分割されます。ここで新しくできた領域は「未割り当て」にしておきます。ubuntuのパーティション等は、ubuntuのインストールの際に行うからです。

 初めの愚痴から、話が長くなりましたので、インストール作業は次回お話します。

ワードクラウドで遊ぶ(1)

 Rで数値データばかり取り扱っていると気が滅入ってくることがあります。Rは文字データも取り扱うことができますね。昔、MeCabを使って遊んだことがあり、以前からテキストマイニングには興味を持っていましたが、それっきりです・・。腰を据えて「テキストマイニング」を勉強してみようかなといつもの思いつきです・・。いつまで続くことやら・・。

 ネットでいろいろ調べている中で「ワードクラウド」というものがありました。最近ブログでもよく見かけますね。Rで簡単にできそうだったので、味見をして見ました。題材は、Steve Jobsの2005年のStanfordの卒業式スピーチです。以前、YouTubeで見たことを思い出しました。

 ネットでそのスピーチのテキスト文を入手し、txtファイルにして、以下のたった4行のプログラムを実行しました。
# パッケージの読み込み
library(wordcloud)
# 単語ベクトルの作成
corpus.en <- tolower(scan("jobs.txt", what = "char", sep = "\n", quiet = TRUE))
word.vector.en <- unlist(strsplit(corpus.en, "([^-a-z0-9]+|--)"))
# ワードクラウドを作成
wordcloud(word.vector.en, min.freq = 2, color = c("blue","green","yellow","pink", "red" ), random.order = FALSE)
結果はこんな感じです。それなりにいい感じです。Jobs180523.png 今度は、日本語バージョンも含めて、題材を変えて色々試してみようと思います。

iPad(第6世代)を買う

 先日、iPad(第6世代)とApple Pencilをセットで購入しました。Apple Storeで購入、48,600円(税込52,488円)也。
 5年半近く、iPad miniを使っていました。出始めすぐに購入したので、第1世代です。1年程度使った頃、電源の異常があって、交換してもらったので、今のiPad mini(これも第1世代)でも4年半近く使ったことになります。
 この数ヶ月、iPad miniの調子が悪く、Wi-FiでWeb閲覧する際に頻繁に落ちてしまったり、データの読み込みが異常に遅い時があり、そろそろ買い替え時期かなと思っていました。

 そういえば、iPad miniの新製品がしばらく出ていませんね。このサイズ、手頃でお気に入りなんですけどね。夜、寝転んで動画を見たりするのに好都合でした。軽く、腕の力もそれほどいらないですね。スマホは必要性から持っておらず、iPad miniがあれば、十分だと今でも思っています・・。iPad miniの新しい型を待ち焦がれていたのですが、結局待てずに、大きさや重量はUpしますが、今回、iPadを購入しちゃいました。
iPad180515_1.pngいつもながらのセンスの良い?箱ですね。早速開封しました。iPad180515_2.png今まで使っていたiPad miniとのサイズも一目瞭然です。iPad180515_3.png
 どのくらい性能がよくなったのか、確認が必要ですね。今まで、Wi-FiでWeb閲覧する際に落ちていたのは当然のごとく皆無になりました。また、サクサクと動く。やはり、iPad miniはお年を召して寿命が近づいていたのでしょう。まだ、使えますが、徐々に新iPadに切り替えていこうと思います。
 まず、スペックを確認するために、モデル番号を確認します。iPadmini_type_180520.pngiPad_type_180520.pngiPad miniが「A1432」、iPadが「A1893」です。Appleのホームページで「モデル番号」と「世代」の対応を確認できます。iPadmini_spec1_180520.pngiPad_spec1_180520.png確かに、iPad miniは「第1世代(A1432)」です(第2世代の製品名はiPad mini2、最新がiPad mini4)。購入したiPadは間違いなく「第6世代(A1893)」で、安心安心。
 また、Wikipediaでスペック一覧を確認しました。iPadmini_spec2_180520.pngiPad_spec2_180520.pngCPU、GPU、メインメモリ、ディスプレイ、Wi-Fi等のすべてにわたって、iPad mini(第1世代)に比べ、iPad(第6世代)の性能が良いことが分かりました。
 ここでふと、iPad miniの対応iOS最新版が、「iOS 9.3.5」と言う記載を見て、そういえば、いつからかiOSが更新しなくなったことを思い出しました。iPadmini_iOS_Version_180520.png現状把握をすると、確かに最新版は「iOS 9.3.5」でした。ちなみに購入したiPadは現時点の最新「iOS 11.3.1」です。iPad_iOS_version_180520.png
セキュリティ面でもOSのアップデートは必要ですね。そうなると古い機種はますます使えなくなってしまいます。そう考えると、いい買い替え時期だったのかもしれません。大事に使って行こうと思います。

博多に帰省する

 GWも今日(5/6)で終わりですが、後半の5/2の夜から昨日(5/5)まで実家の博多に帰省していました。今年の正月は、受験生がいて帰省しなかったので、昨年のお盆以来(9ヶ月ぶり)です。今回は娘との二人旅です。奥さんと息子は予定が合わず留守番です。

 5/3は娘のリクエストで「キャナルシティ博多」へ。「一蘭」でラーメンを食べて、お店を見ながらウロウロしていましたが、そもそも「キャナルシティ」は私のような「おっさん向け」でないですね。時間を持て余したので、飛び出して、近くの櫛田神社へ。博多祇園山笠でおなじみの神社です。お参りして「家内安全」を祈念しました。神社内には山笠の飾り山があります。なかなかいいものです。飾り山180503_1飾り山180503_2
 ちなみに、5/3、4は「博多どんたく港まつり」が行われており、市内のいたるところで催しが行われています。数年前にも見ましたが、今年の盛り上がりはいまいちかな?・・
 天気は2日間共に快晴でしたが、風が強かったですね。心地良いのを通り過ぎて少し肌寒い感じでした。昼間は博多駅周辺でウィンドウ・ショッピングし、夜は両親と食事をしながら会話をしました。年寄りの会話は変化がなく、いつも内容が同じですね・・(余談)。

 話は変わりますが、いまさらですが、博多駅の筑紫口側のデイトス2Fに豚骨ラーメン屋が集まった「博多めん街道」があったんですね。フロア全体に豚骨の匂いが漂い、食欲をそそられます。京都駅にも「京都拉麺小路」がありますが、そんな感じです。
 最近、年のせいでしょうか、お好みの「一蘭」のラーメンが昔に比べ美味しいと思えなくなってきました。店舗数が増えすぎて味が落ちているのかなぁ?
 美味しいラーメン屋を発掘する上で、2日連続(5/4、5/5)で「元祖博多だるま」と「らーめん二男坊」にて食べ比べを行いました。個人的には、「二男坊」のラーメンが美味しかったですね。次に帰省した際にも食べてみようと思いました。

 実家でゆっくりのんびりするつもりでしたが、あっという間に時間が過ぎていった感があります。GW期間で人の多さと移動で大変疲れましたが、両親の元気な姿を見て、博多ラーメンも3種類食べることができ、活力を得ることができました。今日はゆっくり休んで明日からの仕事(現実)に備えることにしようと思います・・。

ご訪問者数

(Since 24 July, 2016)

タグクラウド


プロフィール

Dr.BobT

Author: Dr.BobT
興味のおもむくままに生涯考え続けるエンジニアでありたい。

月別アーカイブ

メールフォーム

名前:
メール:
件名:
本文: