嘉賓發言→人工同傳翻譯→“訊飛聽見”識別人類同傳的譯文,并將其轉化為文本、合成人聲→人工同傳與訊飛翻譯的譯文被同時投放在大屏幕→機器合成的語音在直播中實時投放。
語音斷句算法,能很好地識別詞語和句子的停頓,輸送出更符合人類語言習慣的翻譯結果;
這也就不難理解,為什么訊飛可以在直播中輕松實現實時翻譯,甚至連人類語言中的一些小瑕疵也“如法炮制”,比如在緊張卡詞時用來充數的“就是”,也出現在了直播屏幕上。
背后的邏輯差異在于,AI同傳在毫厘間的表現差異,背后隱藏著從機器翻譯技術集成、神經網絡系統,云主機,到NLP等多種技術能力的集合。
其實,訊飛造假事件中,核心問題甚至不在于AI同傳的技術能力——因為它壓根沒用AI同傳。
雖然依然有諸多技術不完美之處,但進步顯著。尤其搜狗同傳,最近更是登陸了中國網球公開賽的舞臺,成為首個支持國際體育賽事的AI同傳。
賽后采訪中,新科冠軍荷蘭騎手文森特·韋穆倫的發言,被準確高效地翻譯為中英雙語,同步出現在現場的屏幕上。