作為人工智能皇冠上的明珠,自然語言理解不斷吸引著學術界與產業界的目光。然而,在這個極具挑戰性領域,若干理論問題和技術難題尚未得到根本解決,而現實生活和社會中又面臨著巨大的應用需求。如何通過學術界和產業界的共同努力,讓其在實際應用中發揮更大的作用,在研究與應用的相互反饋中共同進步?
為此,在即將于 7 月 22 - 23 日舉行的中國人工智能大會(CCAI 2017)上,中國科學院自動化研究所研究員宗成慶博士牽頭組織了一場以“語言智能與應用”為主題的專題論壇,邀請了中國科學技術大學計算機學院副院長、CCF 會士陳恩紅教授,阿里云智能語音交互技術總監初敏博士,香港中文大學工程學院副院長黃錦輝教授,北京云知聲信息技術有限公司創始人、董事長、CTO 梁家恩博士,奇點機智聯合創始人、ACL Fellow 林德康博士,哈爾濱工業大學博士生導師劉挺教授和上海交通大學計算機系研究員、思必馳公司首席科學家俞凱博士七位嘉賓蒞臨現場,共同圍繞著“目前自然語言處理(NLP)面臨的問題”、“深度學習在 NLP 中的局限性與可能的黑馬”、“學術界與企業界各自對 NLP 技術的關注焦點和預期”、“產學研合作的理想模式”等若干問題展開深度討論,希望在討論過程中所閃現的真知灼見能夠對正在進行相關領域研究與技術開發的從業者提供有益的參考。
作為本次“語言智能與應用”論壇的主席,宗成慶研究員在自然語言處理、機器翻譯和人機對話等領域擁有多年的研究經驗和豐富的技術積累。在大會召開前夕,我們就語言智能相關研究中的若干問題對他進行了先行采訪,他為我們答疑解惑,一解當下之急。
宗成慶,中國科學院自動化研究所研究員、博士生導師,主要從事自然語言處理、機器翻譯和人機對話系統等相關研究,主持國家項目 10 余項,發表論文 200 余篇,出版學術專著和譯著各一部。目前擔任國際計算語言學委員會(ICCL)委員、亞洲自然語言處理聯合會(AFNLP)副主席、中國中文信息學會副理事長、中國人工智能學會理事和 CCF 中文信息技術專委會副主任等學術職務。
CSDN:當前在語言智能方面我們面臨著哪些主要挑戰?對此又該如何攻克?
宗成慶:語音和文字是語言的兩個基本屬性,我們通常所說的語言包括聲音和文字兩種不同的表現形式。所謂的語言智能,在廣義上涵蓋所有以語音和文本為主要處理對象的科學問題和應用技術。對于不同的應用任務而言,所面臨的挑戰也不一樣,例如,文本機器翻譯和人機對話系統,各有各的難點,不能一概而論,但無論什么樣的任務,語義理解是最核心、最本質的問題。
在語言智能研究領域,目前業界與學界采用的技術手段和方法并無本質區別,有的方法原創自學界,而有的技術來自業界,學界和業界已經成為“同一戰壕里的戰友”,就像現代戰爭,難以區分真正的前線和后方一樣,雙方面對共同的“敵人”。如果說有所區別的話,業界擁有更多的數據和計算資源,而學界更多的是在理論方法和模型上追求完美,雙方的協作已經成為共同發展的必然趨勢。
CSDN:那么目前在語言智能方面已經有哪些能夠讓大家學習與借鑒的成功案例?在下一階段,語言智能在行業應用方面又有著怎樣的突破口?對于人工智能的快速發展,作為人類的我們總會產生一種即將失業的恐慌,比如對于自然語言理解研究的深入以及應用普及,諸如同聲傳譯、語言速錄師等的從業人員是否會面臨將被淘汰的窘境?
宗成慶:首先,在語言智能方面,現在已經有了許多相當成熟的落地項目,譬如本次論壇我們邀請到的初敏、梁家恩、林德康和俞凱以及他們的公司(阿里云、云知聲、奇點機智、思必馳),都已經研發出在語言智能方面的成功產品,此外,Google、微軟、百度研發的機器翻譯系統,以及“出門問問”系列產品都是很好的例子。
其次,對于探討在業界應用的突破口,實際上并非我個人能力所能預測,但隨著機器學習和自然語言處理研究的深入,以及計算機硬件性能的快速提高,智能語言技術在很多特定領域趨于實用已經是不爭的事實。
人工智能的高速發展加快了行業的變遷,但關于“人類是否即將失業”的討論卻也一直不絕于耳。在此,我個人并不想用“失業”這個詞把形勢說得那么嚴峻,我也不相信某一項技術可以使人徹底沒事干。我認為,機器的確在很多任務上可以替代人工做大量工作,減輕人的勞動強度,或者大幅度減少人工的需求量,但對于一些需要高度精準處理的任務,完全不需要人的參與恐怕并不現實,同傳和速記也是如此。任何夸大和忽悠某一項技術的做法,都是不負責任的。