2019/09/22
RからPythonへの道(1)
仕事で「データ解析」を行う際にRをよく使います。データ解析を始めた3年前ぐらいは、今ほどPythonの勢いはない感じで、統計はR、機械学習やAIはPythonと棲み分けている感がありました(今も若干そうかな?)。3年前も機械学習やAIに対して懐疑的であったため、データを正しく説明するには統計、Rだよなと思っていました。その後、Rを極めようと半年程度、実務の中で勉強して、一通り苦もなく使えるようになりました。時は流れ、Pythonの勢いが止まりませんね。自宅ではPythonを画像処理やスクレイピング等の「お遊び」に使っていましたが、データ解析には使っていませんでした。ただ、今後のことも考えて、Pythonも本格的に覚えなくてはならないなと思い続けて現在に到っています。
ネット記事か、YouTube動画の内容だったか覚えていませんが、ふと「滅びゆく5つのプログラミング言語」という記事の中で「Ruby、Haskell、Objective-C、R、Perl」が言及されていました。ネット上では、Rubyネタで盛り上がっていますが、仕事で使っているRも入っていたのでショッキングでした。分かってはいるけどね・・って感じですが。
原文をGoogle翻訳さんの力を借りて、訳すと以下の通り。(一部、人工無脳?により修正)
--------------------------------
R
かつて、Rはデータ分析で人気の高い言語でした。しかし、PythonはRの市場シェアを急速に飲み込んでいるようです。 Rはまだ学者やデータ科学者によって使用されていますが、データ分析に関心のある企業は、そのスケーラビリティと使いやすさからPythonに注目しています。その結果、Rはプログラミング言語の人気のTIOBEのインデックスが下がり、他の研究ではPythonを支持してRの使用がゆっくりと減少していることが示されました。
Rが何らかの形で存続するのであれば、データアナリストがRをPythonと組み合わせて使用する可能性があるためです。 「RとPythonの組み合わせは合理的かつ実現可能です」と、CTOであり、カリフォルニア州レッドウッドシティに本拠を置くインテリジェントマーケティングのデータプラットフォームであるQuanticMindの共同設立者であるエンリコアリアントは、今年初めにDiceに語りました。 「社内でデータサイエンスプラットフォームで両方を実行しています。しかし、今日もキャリアを再開する場合は、RではなくPythonに焦点を当てることを検討できます。これは、より広範なアプリケーションを備えたより一般的な言語です。
しかし、そのシナリオでさえ、少数の学者だけが使用するRで終わる可能性があります。それは現実的ではありません。
--------------------------------
9/22時点のTIOBEのインデックスを確認すると以下の通りです。明暗がよく分かります。


個人的には、記事に書かれてある通り、RにはPythonにはない機能もあり、Rをそのまま捨てさることはできないですが、時代の流れに逆らえないので、Pythonも本格的に勉強しなくてならないなと思う今日この頃です。今まで遊びでPythonを組んでいると、Rと似たような所もあるので、そのアナロジーをベースに勉強していこうと思います。また、R-Python間は相互に関数を呼び合えるので、両言語が使えると何かと便利かも知れません。次回から、RのコードをPythonに変換して行く中で、関数や書き方を勉強していこうと思います。長い道のりになりそうです。