據物理學家組織網克日報道,微軟公布了一項關于呆板領略人類語言的重要測試功效,即研究人員得到了迄今最低語音識別會話誤碼率(WER)——6.3%.相關論文頒發在論文預印本宣布平臺arXiv上后,引起了業界存眷。
據相識,該測試是美國國度尺度局(NIST)的2000總機語音識別舉辦的任務。咨詢機構Wall Street Pit評論認為,微軟團隊轉向“作為行業尺度的電話語音識別測試”后果斐然,固定了其在語音識別規模的霸主職位。
闡明認為,微軟取得這一后果來自幾個方面的盡力:研究人員在本年早些時候,應用深度神經網絡技能贏得了一項計較機視覺挑戰;微軟最近在計較網絡東西包(CNTK)中的成熟案例,也是得到本次好后果的要害構成部門。CNTK實現了“深度進修算法”的巨大優化進級,運行速度比本來晉升一個數量級;另一個要害步調是圖形處理懲罰單位的并行練習本領取得了打破。
業內人士暗示,連年來,大型軟件公司科研經費有被縮減的趨勢,且更專注于深度神經網絡的研究,但實際上,語音識別技能的應用更早一些。有評論稱,已往20年中,東莞機房托管 ,研究顯示的計較機語音識別系統的最高誤碼率甚至到達過43%,而隨后最精彩的單系統NIST2000總機誤碼率為6.9%.在克日于舊金山進行的“Interspeech語音通信和技能國際集會會議”上,IBM自滿地公布其誤碼率只有6.6%.但此次微軟公布的6.3%的誤碼率,以微弱優勢取勝。
今朝,微軟已經擬定出了基于語音平臺的人機交互計策,樂成構建起人工智能的要害技能,讓相關語音對話在可穿著設備、智妙手機、伶俐家庭、伶俐車輛及貿易處事中發揮重要浸染。