克日, Vincent Granville在Data Science Central上撰文對2017的數據科學、呆板進修和物聯網舉辦了預測。
以下為譯文
又到了分享對2017年的預言的時候了,這里拋磚引玉,也但愿列位頒發本身的概念。
1. 數據科學和呆板進修將變得更為主流,出格在以下規模:能源業、金融業(銀行、保險)、農業(精耕)、運輸業、都市籌劃、醫療保健(定制治療),甚至是當局方面。
2. 某些數據科學的外行人想要建設正當的,directadmin安裝 directadmin漢化,有關如何闡明數據、算法奈何運轉的體系,并規劃強制果真算法的法門。我相信他們會失敗的,奧巴馬醫改就是一個例子,個中操作的預測算法,忽略了年數性別來計較溢價,導致了人們需要包袱更高的保費。
3. 傳感數據崛起。也就是說,物聯網將帶來數據膨脹,但數據質量、數據相關性及數據安詳仍是至關重要的。
4. 跟著物聯網的崛起,依賴于人工智能、深度進修和自動數據科學的呆板或設備間通信的算法 ,更多的進程將實現自動化(如駕駛、醫療診斷和治療)。我最近也在編寫文章來描寫呆板進修、物聯網、人工智能、深度進修和數據科學之間的差別。你可以在DSC舉辦注冊,防備錯過該文。
5. 人工智能、物聯網、數據科學、呆板進修、深度進修和運籌學之間的邊界將變得恍惚。而統計工程會越來越多地呈此刻應用措施、呆板進修、人工智能和數據科學規模。
6. 很多系統仍然無法正常運轉。其辦理要領在于人而不是算法。我的文章《為何如此多的呆板進修實現都以失敗了卻》中有提及,一個典范的例子就是“谷歌闡明”。谷歌闡明不能捕獲到大量明明且又根基的機器交通流,而這種任務對付人來說,基礎不需要任何統計和數據科學常識來過濾或攔截。固然人們發現了根基的方案來辦理這些問題,但它卻有增無減。虛假評論、新聞,推特上未檢測出的惱恨言論,谷歌搜索上未檢測到的剽竊行為,都屬于同一種別。最終,它為新玩家留下了可以進入和構建實際事情系統的空間。
7. 對民眾數據和民眾新聞的依賴將謀面對更仔細的審查。有人說預測選舉的失敗是數據科學的失敗。但在我看來這是一種差異范例的失敗,它未能意識到媒體的成見(他們宣布的都切合他們自身議程預測),甚至那些做觀測的都是有毛病的(布滿謊話)。同時它也沒有意識到選舉中的高顛簸性以及日常的龐大變革。任何可以或許計較出包括汗青數據的精采的置信區間的人,都認為這是不行靠的預測功效。最后,我一直都認為得勝者最擅長玩花招,包羅哄騙黑客與行賄媒體。
8. 越來越多的數據清理、預處理懲罰和摸索性數據闡明將變得自動化,我們也將面臨更多的非布局化數據,雖然,也會用一些要領來使它們變得布局化。多個算法和模子逐漸殽雜在一起,來提供結果最好的模式識別和預測系統,以提高精度。
9. 在領先的從業者教育的大學課程的引導下,數據科學教誨將不絕成長,通過數據科學營謀事情的人會更少。很多這種范例的練習營不會培訓你成為數據科學家,而是讓你釀成一個只知曉經典的、根基的、甚至過期且危險的統計常識的Python/R/SQL碼農。因此,數據營不得不改進,不然將冒成為另一種鳳凰城大學的風險。
10. 對有關數據的基本建樹的進攻將會從竊取或排除轉變為修改數據。假如安詳裂痕沒有被修繕,某些進攻將從物聯網設備開始。