2018年5月21日,微軟在北京舉行了2018微軟人工智能大會。會上展示了微軟在人工智能領域的技術突破以及一些產品的功能展示,微軟近來在語音領域的發展,尤其讓人印象深刻。InfoQ記者在會后采訪到了微軟全球資深技術院士,微軟云與人工智能事業部負責人黃學東博士,進一步了解到微軟在AI領域的一些進展和規劃。
黃學東博士在微軟工作已經超過25年。25年的時間里,黃博士負責過很多項目,但是有一件事情沒變:他是微軟語音技術的創始人,微軟的語音識別、語音合成技術都是他一手創建出來的。
在25年中,黃學東博士負責過很多東西,包括新產品的研發、通信系統、Bing搜索、搜索廣告、CNTK、深度學習平臺、GPU集群,還有智能客服系統、對話系統,認知服務里面的自然語言處理的所有東西。
黃博士認為,在人工智能發展的過程中,語音和語言也是皇冠上的明珠。他說:“只有掌握了核心的語音和語言技術,人工智能才有希望,否則其它都是在‘忽悠’。”
黃博士告訴InfoQ,目前在“感知”方面,計算機視覺和語音識別進步都很大。在“認知”方面,這個進步還是有限的。微軟機器翻譯第一次達到了媲美人的水平,directadmin安裝,這是非常有歷史性意義的事實。語音和語言是人類進化中重要的東西,而現在,計算機第一次在翻譯質量上超過專業人士的水平,黃博士說:這對人類文明的進展來說是很震撼的。
Q:談到語音識別、自然語言處理,大家更多會想到具體的產品,比如音箱或者一個APP.您認為這個東西就要變成一個大家可以消費的產品嗎?這個產品會是什么樣的業態,目前是不是還處于教育市場得階段?未來會什么樣?
黃學東:這個問題很好。語音技術是一個賦能的技術,所有的開發者都可以把這個技術拿過來,實現他自己想要做的東西,比如智能音箱,因為現在遠場語音識別能力很強了,所以音箱火得不能再火了——“百箱大戰”——今年CES展上基本上就只有兩個東西,一個是自動駕駛,另外一個就是音箱,基本上可以占CES展臺80%的東西。音箱出現很重要的一個原因就是語音識別技術進步到了這個水平,基本上可用了,就是遠場交互都可用了。
再說回來,今年我覺得最熱的是翻譯器,尤其對中國人。因為老美出去走遍世界,他講英文,好像別人都懂,中國人出去一講中文,別人不知道什么意思。在中國每年有1.2億的游客出去。現在我們跟小米生態鏈企業香蕉出行合作推出的魔芋翻譯器,真是物美價廉,基本上只要目前市場上翻譯器1/10的價格。它剛出來不到一個月,銷售基本遍布全國各大城市,而且常常是脫銷狀態。
還有一個有趣的事情。出國到海外就會發現,國內的云服務在國外很難用,在國內做的演示很棒,但出了國云服務就沒法用。香蕉出行的情況是倒過來的,因為我們的云服務是真正覆蓋全球得,它在國外的表現非常好,大家用起來用戶口碑很好,上市不到一個月現在是賣到完全脫銷。這就是微軟人工智能和中國企業結合得非常好的一個案例,我們非常高興,小米也非常高興。雷軍想要給他的領導班子每人送一臺——對不起缺貨,這是真的故事。
Q:在您看來,從技術上說翻譯特別是中英翻譯,是不是已經可以實現大規模產業化了?
黃學東:技術上已經是了。今天在我的演講中演示了一個表,微軟最新的機器翻譯系統已經達到了69分。機器翻譯這個東西不像語音識別是一對一,只有唯一的答案,機器翻譯是多對多的,每個答案都可能是準確的,所以在評價機器翻譯的時候,現在只能靠人來評,當然老師也很嚴格,100和0之間相差很大。我們根據人來評的話,其實現有的商用系統像微軟和谷歌的,在標準的測試集上分別在56分、54分左右,中國企業的研發能力也很強,像搜狗公司,在微軟推出最新突破之前有最優秀的系統,達到了62分的水平……
Q:您在演講中提到微軟會跟中國移動去合作,這一部分有什么可以分享的?定制化云服務感覺上只是針對聲調的不同進行區分,在人工智能上有什么樣的差異化?
黃學東:我今天講的內容非常多,我大概梳理一下。今天講了一個事情是中國移動和微軟正在合作,用微軟的語音識別技術幫助他們解決客服中心的一些技術問題,這是一個非常了不起的事。因為中移動是全球最大的電信運營商,他們現在用最優秀的技術滿足他們的客戶需求,這本身就是一個有意義的創舉。微軟公司的人工智能技術、語音識別技術和全球最大的電信商合作,解決用戶的實際工程需求。這是一個中美兩國合作,讓用戶更加滿意的一個非常好的案例。
第二,微軟最近推出了很多全新的產品和服務,包括統一的語音識別API,我們可量身定制所有的語音識別、語音合成、喚醒詞和機器翻譯系統。