【IT】データサイエンス向け言語はRとPythonのどっち?

1田杉山脈 ★2019/06/21(金) 12:01:56.83ID:CAP_USER
このほど、「matloff/R-vs.-Python-for-Data-Science|GitHub」に、データサイエンスで利用するという観点からプログラミング言語であるRとPythonを比較した記事が掲載された。これまで、データサイエンスの分野ではRが使われることが多かったが、近年はPythonの利用が進んでいる。

記事の執筆者であるNorm Matloff氏はカリフォルニア大学デービス校におけるコンピュータサイエンスの教授。以前は、同大学で統計学の教授だったようだ。同氏はR関連の書籍を4冊執筆しているほか、現在はR Journalの編集長を務めている。同氏はこれまでの経験および統計学者/コンピュータ学者という視点から、今回のトピックに関して有用な光を当てることができるだろうと説明している。

執筆段階で掲載されている比較の主な内容は次のとおり。

項目 内容
優雅さ 明らかにPythonの勝ち。主観的ではあるもの、これまでさまざまなプログラミング言語を使ってきた経験や教育してきた経験から、Pythonにおける括弧や中括弧の利用が大幅に減少したことにとても感謝している

学習曲線 Rの大勝利。Pythonを使ってデータサイエンスを始めるにはNumPy、Pandas、matplotlibなど、Python以外のライブラリについて学ぶ必要がある。また、パッケージ構成も時に難しい。Pythonに比べると、Rには行列型と基本的なグラフが最初から組み込まれており、数分以内に簡単なデータ解析を行うことができる

データサイエンス向けライブラリ Rがちょっとだけ優勢。CRANに登録されているパッケージは1万4000個ほど、PyPIに登録されているパッケージは18万3000個ほどとPytPIのほうが多い。しかし、データサイエンスに関するものはそれほど多くない

機械学習 Pythonがちょっとだけ優勢。多くの人にとって機械学習はNNを意味しており、NN用ソフトウェアの多くはPythonに関連している

統計的な正確さ Rの大勝利。Rは統計学者によって統計学者のために開発されている

並列計算 引き分け。RもPythonもベースバージョンはマルチコア計算に対して優れたサポートを提供しているとは言い難い

C/C++インタフェース Rがちょっとだけ優勢。どちらにもC/C++インタフェースは存在しているが、PythonのそれはRと比べるとそれほど強力なものではない

オブジェクト指向/メタプログラミング Rがちょっとだけ優勢。どちらもオブジェクト指向をサポートしているが、RのほうがPythonよりも真剣度が高い

言語の統一性 Rはとてもひどい状況。Rは複数の実装系が存在しており、使っていない実装系のコードは読むことが難しい状況になっている

リンクデータ構造 Pythonの勝ち。Pythonでは簡単に実装することができる

オンラインヘルプ Rの大勝利。Rのhelp()関数はPythonよりも情報が多い
以下ソース
https://news.mynavi.jp/article/20190619-845288/

2名刺は切らしておりまして2019/06/21(金) 12:06:45.42ID:nN+3LQrd
C#
3名刺は切らしておりまして2019/06/21(金) 12:08:14.88ID:BakQS1zZ
データ分析クラスタも機械学習クラスタも
仕事や勉強で忙しくて
こんなクソみたいなところに書き込んだりせんだろ。
4名刺は切らしておりまして2019/06/21(金) 12:08:14.94ID:9YVJ9qiw
うーん、用途と使う層が違うから
比べてもしょうがないよな
ただ、統計の勉強にはRがいいと思うし、それからpython
使ってもいいだろうし、まあ両方使えば良いんじゃない。
R は、すぐにやってみられるし、検算用でも良いしね
5名刺は切らしておりまして2019/06/21(金) 12:10:23.11ID:9YVJ9qiw
Rは、プログラミング言語ではあるけど
数学処理系といった感じですぐ使えるから、両方で良いんじゃないかい
6名刺は切らしておりまして2019/06/21(金) 12:13:17.57ID:nN+3LQrd
Pythonはアホでも使えるという理由だけで
機械学習まわりで広く使われてるというだけだからな

自前で実装するなら言語は何でもいい

7名刺は切らしておりまして2019/06/21(金) 12:13:29.43ID:9YVJ9qiw
しつこいけど、maximaも覚えとくと便利かもよ
微分とか記号のまま出来るし
こういうのは、同じ言語でも、数学知ってれば
そこそこ使えるからね。あ、別にpython目の敵に
してるわけではないよ。両方使えれば、もっと
便利だ、って言いたいだけだよ
8名刺は切らしておりまして2019/06/21(金) 12:13:47.22ID:BuCQ0Poa
これからはPython主流になるんじゃないの
Perlが食われたように、Rも消えていきそう
9名刺は切らしておりまして2019/06/21(金) 12:15:56.01ID:9YVJ9qiw
消えないよ、これ古ーい言語だから
今消えてないなら、もう消えないよ
ほんとは言語というより、電卓みたいなもんだから
10名刺は切らしておりまして2019/06/21(金) 12:16:05.82ID:3upXEPJ6
C言語
11名刺は切らしておりまして2019/06/21(金) 12:32:54.68ID:XDit8KU9
どっちもかじっておけばいいだろう
12名刺は切らしておりまして2019/06/21(金) 12:44:49.01ID:zeaC2kj3
JAVAとC言語みたいに住み分けるだろ
13名刺は切らしておりまして2019/06/21(金) 12:54:28.82ID:nff+SbpO
Rしか使えないっす
というか、統計に関してはネット上の情報量がRの方が多いし…
14名刺は切らしておりまして2019/06/21(金) 13:05:37.38ID:xjVbB2Vx
これからは Julia だろ。
15名刺は切らしておりまして2019/06/21(金) 13:46:29.66ID:Lc1Al9Lz
ボッキデータは両刀使い
16名刺は切らしておりまして2019/06/21(金) 14:25:12.35ID:ok3A4L/d
あんまり用途はかぶらない気がするが、ありうるとすればPythonがRの用途を取り込んでしまう方向
17名刺は切らしておりまして2019/06/21(金) 14:47:54.44ID:Jk7mMINv
それ以前にデータサイエンスってのがwww
19名刺は切らしておりまして2019/06/21(金) 16:55:56.82ID:ZWXr3onA
>>17
昔からやっていることでも、それらしい名前を付けると人が集まってくるんだよなぁ・・・
18名刺は切らしておりまして2019/06/21(金) 15:59:32.67ID:WdlPGyo5
dplyrがあるからRの勝ち。
20名刺は切らしておりまして2019/06/21(金) 16:58:44.75ID:AHaHV+QF
>>18
なかったらRの完敗。

あったところで、やっと引き分け

21名刺は切らしておりまして2019/06/21(金) 19:03:31.24ID:pYBjEZPM
Octaveは?
23名刺は切らしておりまして2019/06/21(金) 20:30:12.36ID:K2tWIYhk
>>21
全敗
22名刺は切らしておりまして2019/06/21(金) 20:10:06.74ID:6gquBkyv
Maxima + Octave が最強だって早く気づけばいいのに
24名刺は切らしておりまして2019/06/21(金) 22:57:54.57ID:XiUewTyv
C++は万能の神、異論は認めない
25名刺は切らしておりまして2019/06/22(土) 00:49:32.50ID:5DQJmYDI
 
Rは分析ツール
pythonはデータシステム記述

という認識なんだが

28名刺は切らしておりまして2019/06/22(土) 03:00:20.68ID:jOao2o59
Rもpythonもc++も使ってるけど
pythonは正直要らない
29名刺は切らしておりまして2019/06/22(土) 03:01:22.65ID:tbeDjRVt
stata使いは俺だけか?
30名刺は切らしておりまして2019/06/22(土) 03:08:00.31ID:zYE8Fgkb
Rは言語仕様的に微妙なところが多い。
例外処理とかNAとかほんと糞。
31名刺は切らしておりまして2019/06/22(土) 03:32:57.34ID:ho6smbHm
S言語だろ
32名刺は切らしておりまして2019/06/22(土) 08:22:00.80ID:PshVvh2e
言語は手段
要は伝われば良い
33名刺は切らしておりまして2019/06/22(土) 10:01:47.58ID:t7F+MetD
コードかけないでーたさいえんちすと
出した結果とやらも再現性なし
34名刺は切らしておりまして2019/06/22(土) 10:38:00.57ID:6iNqGOOx
ベテランは
 エクセルマクロで頑張れ
35名刺は切らしておりまして2019/06/22(土) 10:59:42.77ID:mETSYX/M
Excelはビックデータ開けんでないか。
DB+シェルスクリプト で大半はできるけど、R使うのって、何計算させるんだ?
37名刺は切らしておりまして2019/06/22(土) 11:42:51.28ID:XYdhKkxT
MathematicaとC++でおk
38名刺は切らしておりまして2019/06/22(土) 12:00:06.56ID:xCBA36C0
おいくら万円や!

引用元:http://egg.5ch.net/test/read.cgi/bizplus/1561086116/