據(jù)海外媒體報道稱,谷歌高級研究員杰夫-迪恩(Jeff Dean)內(nèi)地時間周三在于加州圣克拉拉召開的人工智能前沿峰會(AI Frontiers Conference)上暗示,谷歌自2012年以來已經(jīng)將語音識此外錯誤率低落了30%以上,這對付如今AI當?shù)赖目萍家?guī)模來說可謂意義不凡。
在這兒,迪恩所說的語音識別錯誤率是指“谷歌將一個詞語從語音轉(zhuǎn)錄成為文字時的錯誤率”。迪恩暗示,谷歌自2012年以來已經(jīng)樂成將這一錯誤率低落了30%以上。與此同時,一名谷歌講話人也同科技媒體VentureBeat證實了這一數(shù)據(jù)的精確性。
迪恩暗示,這一語音識別錯誤率的下降得益于神經(jīng)網(wǎng)絡的應用。今朝,包羅谷歌和其他企業(yè)均在深度進修中利用了這一神經(jīng)網(wǎng)絡技能,研究人員通過利用大量數(shù)據(jù)對神經(jīng)網(wǎng)絡舉辦練習。好比通過大量的語音片斷操練,然后讓他們基于已經(jīng)獲悉的內(nèi)容對新數(shù)據(jù)作出揣度。
動靜稱,谷歌最早在2012年,也就是Android“果凍豆”系統(tǒng)宣布的時候首次將神經(jīng)網(wǎng)絡技能應用于語音識別規(guī)模。詳細來說就是,當用戶向Android“果凍豆”系統(tǒng)的語音識別軟件措辭時,聲音頻譜會被解析并發(fā)送到谷歌全球處事器“雄師”中的八臺電腦,隨后由認真開拓這個項目標谷歌研究科學家文森特-凡毫克(VincentVanhoucke)及其團隊開拓的“神經(jīng)網(wǎng)絡”模子舉辦處理懲罰。
凡毫克在其時就暗示,與此前版本的Android系統(tǒng)對比,“果凍豆”語音識別系統(tǒng)的誤差率要低25%閣下,而這能讓用戶越發(fā)愿意利用語音呼吁。
在此之后,盡量這一技能的成長影響著越來越多的谷歌產(chǎn)物,但該公司卻鮮有果真接頭本身在語音識別技能上取得的希望。2015年,谷歌CEO桑德加-皮查伊(SundarPichai)曾暗示“谷歌語音識此外錯誤率約為8%”。
蘋果Siri團隊資深總監(jiān)、前微軟語音識別項目高管亞歷克斯-阿賽洛(Alex Acero)在去年8月接管Backchannel主編史蒂芬-列維(StevenLevy)采訪時透露,Siri在所有語言中的錯誤率低落了兩倍,甚至在很多環(huán)境下高出了兩倍。另外,微軟也在去年9月份暗示,旗下語音識別技能的墮落率已經(jīng)降至6.3%,沖破了IBM超等電腦沃森之前保持6.9%的墮落率記載。
事實上,為了能在這場技能革擲中處于領(lǐng)先位置,包羅亞馬遜、蘋果、谷歌和IBM在內(nèi)的科技企業(yè)都已經(jīng)開始面向消費者提供語音識別技能。好比,荷蘭服務器 英國主機租用,蘋果不久前在Siri中添加了第三方整合成果,答允它與第三方應用通訊,這意味著用戶將可以操作Siri處事直接呼喚Uber專車。
然而,假如要想成為消費者最主要的計較平臺,語音助手仍需迎來進一步改造。凱鵬華盈闡明師、被巴倫雜志冠以“互聯(lián)網(wǎng)女王”稱謂的瑪麗-米克爾(Mary Meeker)就暗示,語音識此外精確率必需到達99%閣下才有大概成為最有效的計較輸入形式。