雇用告白的數量能必然水平上回響每一種軟件的風行水平,并從中預測出哪一種在未來會越發風行。以美國最大的雇用網站Indeed.com為統計平臺,通過對某一天數據科學地位的雇用數量舉辦統計闡明,得出數據科學軟件的變革趨勢。
為了公正,directadmin安裝 directadmin漢化,本文回收了一種專門的要領,用來在數據科學地位范疇內統計每種軟件的雇用數量,文中所有的圖片也都是在這個前提下取得的,統計日期為2017年2月24日。
正文
各類軟件雇用量見下圖。個中最多的是SQL,快要18000,然后別離是Python和JAVA(13000閣下),Hadoop(10000閣下),R,C系列和SAS(這是R首次在在數據科學地位陳訴中高出SAS),Apache Spark,Tableau(5000閣下,限數據科學地位),Apache Hive(3900閣下),Scala,SAP,MATLAB,SPSS。個中Scala,SAP,MATLAB,SPSS均為2500閣下。
雇用量小于250的軟件列在了下圖中,別離是:Alteryx(240),Microsoft(Azure Machine Learning and Microsoft Cognitive Toolkit,157),Julia,FORTRAN,Apache Flink(125),H2O(100)。以操縱容易為賣點的SAS Enterprise Miner、RapidMiner和KNIME雇用量都是90閣下,或許是因為各公司認為沒有須要禮聘專家?SPSS模塊也是同樣范例的接口,但卻只有50個地位。開源的MXNet深度進修框架有34個地位,而Tensorflow是它的12倍,可是兩者都很年青,有足夠大的潛力在將來快速成長。
下面我們先來看一下R是如何高出SAS的。從下圖可以看出,在2012年到2017年2月28日這個時間段,SAS的地位需求一直都很不變,而R則不變增長并最終在2016年早期高出了SAS。別的按照blog post所述,R于2015年就已經在學術出書物中高出SAS。
再來看一下Python和R。Python和R誰更風行的爭論是由來已久,可是從來都沒有幾多數據支持。可是單從雇用地位上來看,Python于2013年就已經高出了R(如下圖)。雖然我們要清楚,R只是純真用來舉辦數據闡明,而Python在數據科學規模用途更遍及。