有很多讀者在跟我們交流時,都會提到非常驚訝于人工智能居然可以做這么多令人意想不到的事。從下圍棋到自動駕駛,從辨識古文字到宇宙測繪,似乎有點無所不能的意思。也有讀者希望我們做個專題,專門列一個“你想不到AI居然可以做這些”的清單。
非常非常不好意思,我可以非常負責任的說,這清單太容易了,但問題是根本列不完。即使不考慮技術的可能性,僅僅是每天統計新的論文和研究報告里又讓AI能做什么了,那都是個近乎無法完成的工作。
但這并不是說AI已經無所不能。事實上,AI在絕大多數基礎工作中并沒有傳統計算機效率高,完全談不上取而代之。AI總能在意想不到的領域冒出來,是因為它采取了完全不同的底層策略,專注于解決那些經典計算和人工無法解決的問題。
所謂魚不如漁,與其大家一起感嘆“AI居然能做這個!”不如來思考“如何知道AI還能做哪些”。想要獲得這個能力,就需要知道今天主流AI解決方案的依據是什么。這就不得不提一個對AI發展至關重要的名字:貝葉斯。
想要尋找上帝,卻找到了人工智能
假如沒有貝葉斯他老人家,實在很難想象今天的人工智能會怎樣。也不僅是人工智能,可能統計學、應用數學、測繪學、醫學,甚至犯罪學都會受到巨大的影響。
但對學術如此重要的一個人,卻根本不是一位科學家。生活在300年前的托馬斯·貝葉斯,是英國的一名牧師。當然,同時還是一位業余數學家。
可能是出于把愛好和工作融合到一起的考慮吧。貝葉斯提出了將歸納法應用于概率統計的方法,希望能以此向世人證明上帝是存在的。但很不幸,三百年之后上帝存在的依據依然未找到,但貝葉斯決策卻在無數科學領域開花結果。
所謂貝葉斯歸納,其實基礎原理非常簡單。比如說一個人做了一件好事,那他是不是個好人呢?顯然不一定。但是假如一個人每天都做好事,那他是不是一個好人呢?其實也不一定,也可能他在背后十惡不赦喪盡天良,但假如沒有他做壞事的證據,每天做好事就是好人顯然已經概率非常大了。
這就是貝葉斯歸納的核心邏輯:不必獲取所有證據之后再進行判斷,而是結合已知條件先進行判斷,再通過數據不斷去驗證、調整、修改這個判斷,讓它無盡趨于合理化。
這個邏輯聽起來蠻簡單的,并且好像還有點不靠譜,在貝葉斯生前他的想法甚至沒有發表出來。即使其死后的兩百多年里,貝葉斯歸納也沒有得到多少重視。因為從數據嚴謹性出發的經典統計學顯然可以更好的接觸事物本質,而不是像貝葉斯歸納一樣用“猜”來開啟計算。
直到上世紀七八十年代之后,沉寂百多年的貝葉斯理論開始重新在統計學中被重視。
因為經典統計學雖然可靠,但是卻需要依靠完整的數據模型,往往效率太低,無法滿足實際需求。
比如說在搜尋海面遇難船只時,經典統計學需要每個海域的氣象數據、監控數據、過往船只數據,然后綜合計算這些因素來精準定位。但事實上,這些數據是不可能馬上齊全的,即使可以,分秒必爭的搜救工作也不能等。
而用貝葉斯理論來解決這個問題,會先讓有經驗的專家主觀判斷船只失事海域,然后通過不斷獲得的數據一點點修正專家的判斷,爭取在最短時間內解決問題——這就是著名的1968年美國天蝎號潛艇失事事件,也是貝葉斯理論進入應用化的標志。
貝葉斯理論在工作中強調從人類先驗知識出發,對目標進行模糊判斷,新加坡云主機 香港云主機,然后不斷學習進行判斷校對,這成為了后來大量人工智能技術的誕生起點。
300年前,本來希望用來證明上帝存在的理論,在300年后卻成為了人工智能的基礎,這是一個悲傷的故事呢?
還是說貝葉斯牧師其實已經找到了正確答案?
貝葉斯意識:一切學習型AI的基礎
與0和1組成的經典計算不同,貝葉斯計算不需要建立在完整的數據基礎上就能獲得答案。這種不完全數據推理能力,與人類思維中的認知與判斷過程非常相似。于是產生了數量眾多的貝葉斯理論與AI結合,運用于不完全信息推導的技術模型。
比如說貝葉斯網絡、貝葉斯分類器、貝葉斯邏輯,都是如今非?;A的AI工具。貝葉斯網絡更是可以看做機器學習理論自證有效的基礎條件。而貝葉斯方法也被廣泛運用在NLP、機器視覺、知識圖譜等領域,成為優化結果型算法與技術的支撐。