QQ在線客服

當前位置:首頁> 資訊> 科技評論

人工智能設備又邁進一步能讀懂唇語

2016-11-29 09:46 來源: 站長資源平臺 瀏覽(793)人   

    人工智能設備又邁進一步:能讀懂唇語。據(jù)外媒報道,一種新型的語音合成器可以跳過語音記錄,而直接將說話者嘴部動作轉換為語句。


人工智能設備又邁進一步能讀懂唇語


    該設備能“觀看”嘴唇的動作,并利用人工智能網(wǎng)絡將它們轉換成聲音。


    研究人員表示,該設備將能幫助聲帶麻痹患者發(fā)聲,向腦機接口又邁進一步。


    描述該裝置的研究發(fā)表在《PLOS計算生物學》期刊上。


    這項研究的作者來自法國國家科學研究中心。文章中提到,“這種語音合成器將人體主要語音發(fā)音器(舌,顎,口和嘴唇)的運動轉換成智能語音。“


    說話者的發(fā)言,以及嘴部各個部位的位置會被同時記錄,然后通過人工智能網(wǎng)絡算法進行分析。


    此處使用的人工智能算法是基于人類大腦建模的深層神經(jīng)網(wǎng)絡(DNN)。算法設計針對偏復雜的模式識別。


    該深層神經(jīng)網(wǎng)絡DNN通過測量舌頭、下顎、軟腭和嘴唇的協(xié)調動作(又稱為”發(fā)音語音信號“)來識別嘴正在發(fā)音的某個詞語。


    作者解釋道,DNN計算模型對這些測量的數(shù)據(jù)進行訓練,將”發(fā)音語音信號“轉換成”聲學語音信號“。


    作者提到,”這項研究中,我們讓用于訓練DNN模型的用戶,以及陌生新用戶都來測試語音合成器的實時控制性能,從而評估它在是否能很好地成為腦機接口的一部分。


    “語音腦機接口將能通過解碼皮層的語言相關活動,實時控制語音合成器,從而幫助有嚴重發(fā)聲障礙的人恢復交流。


    為幫助連聲道都無法震動的患者”說話“,科學家將必須掌握如何解碼大腦信號,并將其翻譯成語音。


    使用人工智能來解碼語音和語言已有先例。


    谷歌不久前推出了多語言之間機器翻譯系統(tǒng)。該系統(tǒng)被成為“Zero-Shot翻譯系統(tǒng)“,并具有自我學習能力。它能將未學習過的兩種語言翻譯成一種已經(jīng)學習過的語言 ——換言之,通過人工智能訓練學習了如何實現(xiàn)X語言對Y語言的翻譯后,系統(tǒng)就能立即自動掌握從X到Z語言的翻譯。


    Google Brain的博文把這項翻譯技術稱為神經(jīng)機器翻譯系統(tǒng)(Google Neural Machine Translation ,簡稱GNMT)。


    2898站長資源平臺友情鏈接交換:http://www.afrimangol.com/friendchange.htm 


【版權與免責聲明】如發(fā)現(xiàn)內容存在版權問題,煩請?zhí)峁┫嚓P信息發(fā)郵件至 kefu@2898.com ,我們將及時溝通與處理。 本站內容除了2898站長資源平臺( www.afrimangol.com )原創(chuàng)外,其它均為網(wǎng)友轉載內容,涉及言論、版權與本站無關。
投稿

關注我們

站長資源平臺微信公眾號

微信二維碼