Python超過R,成為數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的最常用語(yǔ)言
近日,數(shù)據(jù)挖掘資訊網(wǎng)站KDnuggets開展了一項(xiàng)調(diào)查,問題是“2016年和2017年,在數(shù)據(jù)分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工作中,你運(yùn)用R、Python、兩者都用,還是其他工具?” 對(duì)954名受訪者的調(diào)查顯示,Python尚未完全“吞噬”R,但2017年P(guān)ython生態(tài)系統(tǒng)已經(jīng)超越了R,成為數(shù)據(jù)分析、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域領(lǐng)先的平臺(tái),同時(shí)也在迅速吸引其他平臺(tái)的用戶。 2016年,Python排名第二(“主要運(yùn)用Python”占比為34%,“主要運(yùn)用R”占比為42%),而在2017年的結(jié)果中,Python和R的占比分別為41%和36%。 在KDnuggets的讀者中,同時(shí)運(yùn)用R和Python的比例也從2016年的8.5%上升至2017年的12%,而運(yùn)用其他工具的比例從16%下降至11%。 △ 2016年和2017年,在分析、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)中,運(yùn)用Python、R、兩者都用、其他工具的份額 隨后,我們可以看看用戶在不同平臺(tái)之間的轉(zhuǎn)移。 △ 從2016到2017年,用戶在Python、R、兩者都用、其他工具間的轉(zhuǎn)移情況,上圖看起來有些復(fù)雜,但我們可以專注于兩個(gè)關(guān)鍵方面。Python在這兩個(gè)方面都保持領(lǐng)先。 忠誠(chéng)度:Python用戶的忠誠(chéng)度更高。2016年,Python用戶中的91%依舊繼續(xù)運(yùn)用Python。而在R的用戶中,這一比例只有74%,在其他平臺(tái)中只有60%。 轉(zhuǎn)移比例:大約10%的R用戶轉(zhuǎn)移至Python,但只有5%的Python用戶轉(zhuǎn)移至R。在2016年同時(shí)運(yùn)用兩種工具的用戶中,只有49%依舊同時(shí)運(yùn)用兩者,而38%轉(zhuǎn)而主要運(yùn)用Python,只有11%轉(zhuǎn)而主要運(yùn)用R。 接下來,我們來看看最近幾年的變化趨勢(shì)。 △ 2014年到2017年,Python、R和其他平臺(tái)份額的變化 可以看到,R的份額正在緩慢下降(從2015年的約50%下降至2017年的約36%),而Python的份額則穩(wěn)步上升,從2014年的23%上升至2017年的47%。其他平臺(tái)的份額也在緩慢下降。 在2015年關(guān)于R和Python的調(diào)查中,我們沒有提供“同時(shí)運(yùn)用Python和R”的選項(xiàng)。因此為了比較過去4年的數(shù)據(jù),我們將2016年和2017年P(guān)ython和R的份額按照如下公式來計(jì)算: Python總份額 = (Python份額) + 50%(同時(shí)運(yùn)用Python和R的份額) R總份額 = (R份額) + 50%(同時(shí)運(yùn)用Python和R的份額) 最后,讓我們看看各地區(qū)的趨勢(shì)和模式。參與調(diào)查的用戶來自各地區(qū)比例如下: 美國(guó)/加拿大:40% 歐洲:35% 亞洲:12.5% 拉美:6.2% 非洲/中東:3.6% 澳大利亞/新西蘭:3.1% 為了簡(jiǎn)化表格,對(duì)于“同時(shí)運(yùn)用R和Python”的份額,我們以同上的方式進(jìn)行處理,并將亞洲、澳大利亞/新西蘭、拉美,以及中東/非洲合并為“其他”地區(qū)。 △ 2016、2017年,Python、R、其他工具在各地區(qū)的運(yùn)用情況 在這3大地區(qū)中,我們觀察到同樣的模式: Python的份額上升8%到10%?! 的份額下降2%到4%?! ∑渌脚_(tái)的份額下降5%到7%?! ython用戶的未來看起來很光明,但我們認(rèn)為,考慮到當(dāng)前用戶數(shù)規(guī)模龐大,R和其他平臺(tái)仍將在可預(yù)見的未來保持一定的份額。