如果說人工智能正在成為谷歌帝國所有產品的血液,那么“谷歌語音助手”就是打通各個產品的器官。
5月8日在美國加州山景城舉辦的Google I/O開發者大會,沒有發布任何新硬件產品。卻看到了一個可以稱得上再造谷歌的“舊品”——谷歌語音助手(Google Assistant)。
“谷歌語音助手”是谷歌在2016年發布的產品,它是類似于蘋果Siri的語音助手,最早的承載主體是谷歌智能音箱Google Home和手機上的語音軟件。語音助手早以不是新鮮的事情,但是軟件系統的提升讓它更加“聰明”;人工智能的指數級成長,它正在變成一個如同電影《Her》那樣,擁有人類智力的產品。
語音助手是整場Google I/O大會的重頭戲,先來看看它哪些地方進化了:
當這款“語音助手”打電話給理發店幫助主人預定剪發時間時,現場所有人都驚訝于它到底是一個人還是一個機器。如果說早前的機器說話還是生硬的刻意的,谷歌助手有著個性化的人聲。比如當店員說“給我一些時間”,這個小助手輕松的一聲“嗯哼”,仿佛一個正在思考的人。現場有人感嘆,對這個展示突然生出一些“恐懼感”,因為以后可能無法分辨是不是在跟機器人對話。
機器正在像人一樣思考,還是像“聰明人”那樣思考。緊接著展示了一個語音助手訂餐失敗的案例,原因是餐廳滿員了。但這個餐廳服務員不按套路說話,當服務員自己陷入一片混亂中時,谷歌助手表現的比人還要理智,它試著幫服務員理清思路。
Google將這項技術成為Google Duplex,指解決一個我們打電話才能完成的事。現場演示是最終谷歌希望達成的狀態,現在它還處于早期階段。
今年,這款產品中加入了6種口音類型,并以美國著名歌手John Legend的聲音為聲源。不要小看這些越來越自然的人聲,谷歌只需要一點點聲音的原始材料,就可以生成相似度極高的聲音形象。這種與人聲無異的聲音,最直觀的感受是,比和機器人交流更無障礙感。
“語音助手”從2016年發布以來,還只是一個能夠簡單展示音樂電影、識別主人聲音,以及撥打電話的小助手。今年,這款產品在對話上表現的更加智能,它不需要每次都用“Hey Google”喚醒,可以與人連續對話,可以回答比賽結果、查詢下一次比賽信息這些稍稍復雜一些的功能。
“打開勇士比賽和爆米花機器。”“調暗客廳與廚房的光線。”它可以理解并且處理多線程的任務。同時,這款語音助手還可以幫助你預定星巴克咖啡。目前谷歌已經開始與Doordash、711、星巴克等餐飲品牌合作。
“谷歌語音助手”還將推出一個可視化的機器,這款產品曾經在CES上展示過,它可以顯示導航路線、菜譜視頻等,現場展示了一段如何通過語音提問就可以獲得做飯教程的視頻。今年7月,聯想、三星、JBL都將發行這種搭載了“谷歌語音助手”帶顯示屏的音箱。
“AI是人類社會最重要的事情,它比電與火有著更加深遠的意義。”谷歌首席執行官桑達爾?皮查伊(SundarPichai)曾經說到。這場發布一開始,就系統介紹了AI落地場景,如通過視網膜檢測糖尿病;通過理解上下文,半自動書寫郵件;把黑白照片恢復成彩色,以及谷歌語音助手的一系列智能化操作。
無論是更智能的回答問題,還是幫助訂餐,“語音助手”背后正是人工智能技術的突飛猛進。從嘲笑語音識別的準確性,到如今可以和人類“帶情緒”的對話,如果說人工智能正在成為谷歌帝國所有產品的血液,那么“谷歌語音助手”依賴搜索技術,正在成為打通各個產品的器官。
它正在打通智能家居、搜索、地圖、線下服務,成為一個新的平臺。谷歌語音助手接入手機、汽車與智能家庭設備達5億臺,支持30多種語言,進入了80多個國家與地區,中國地區依然不支持這款應用。今年6月,語音助手也將嵌入谷歌地圖中。
IBE Tech公司聯合創始人Joye Deng告訴《財經》,這次大會感受最深的是,谷歌是如何讓產品觸及到更多人,以及如何讓人們更簡單的使用產品。“語音助手只需要簡單的說話,就可以完成與機器的互動,降低了爺爺奶奶們使用互聯網產品的門檻。”這是他受到最深刻的啟發,讓交互變的更簡單,使用更便捷。
在現場展示中,一位老奶奶說著非常不標準的英文:“嘿,勾勾;嘿,勾勾”。在一次又一次失敗后,語音助手最終在不標準呼喊的反復訓練后被“喚醒”,并開始為老奶奶服務。