
MIT開發出一款人工智能系統,該系統可“觀看”無聲視頻並生成該視頻應該包含的聲音
人工智能已經突破了一項聲音障礙。麻省理工學院(MIT)的研究人員開發了一款人工智能系統,可以“觀看”無聲的視頻並且生成一段聲音,效果十分逼真,以至於多數觀眾無法分辨出這些聲音是否是計算機生成的。
MIT計算機科學和人工智能實驗室(MIT Computer Science and Artificial Intelligence Laboratory)稱,其“深度學習算法”是頭一個通過“聲音圖靈測試”的,生成的聲音能夠以假亂真。
這款視覺指示聲音系統(Visually Indicated Sounds,簡稱Vis)受到訓練,能夠對棍子擊打、刮擦或者捅一系列物體(從樹葉、水到土壤和鋼鐵)時發出的聲音進行分析。
研究人員稱,Vis的本領可以延伸至很多其他場景。例如,未來的版本可以為電影和電視生成比傳統方法(比如在鋁箔上撒鹽以模擬雨聲)更逼真的聲音效果。
該項目的負責人安德魯•歐文斯(Andrew O...