Google利用AI分辨出聲音讓你在吵雜環境中只聽到特定某人的聲音

2018/04/18 by 詩伊

#google #深度學習

影片中的吵雜環境，讓你聽不清楚重點怎麼辦？Google現在透過AI技術，可以將噪音降低，提高觀眾指定的人聲，讓它變更清楚!

Google的AI團隊一直不斷在進步，最近他們的團隊不只訓練電腦辨識出拉麵是從哪一間拉麵做出來的之外，更厲害的是他們蒐集了Youtube中十萬部影片進行訓練，讓特定的人聲可以獲得增強，而其他聲音可以被壓低！

主要是透過音訊與視訊的結合，Google給了大家一系列影片，首先是兩個同時在說話的講者，AI分析了他們的聲音、臉部表情、嘴型之後，可以讓觀眾調整現在想聽哪一邊講話！本來是同時一起說話，根本聽不清楚兩邊在講什麼，但就可以透過電腦把其中一方靜音，可以聽得更清楚

▼以圖像呈現這概念的話，就是利用臉部表情與聲音結合，讓電腦將Jon的表情跟聲音連結在一起，於是能讓人自由選擇要聽哪一邊的聲音

同樣的，像是這個運動爭辯節目(?)也可以同樣的讓其中一方消音!讓你可以清楚聽見某一方的聲音，不然他們一起講話，我真的只聽得到一片嗡嗡嗡的噪音(頭痛)

當然還可以用在吵雜環境中，Google的AI技術可以找到主要說話者的聲音，將背景音變小，有一點類似人類在聽某個人說話的時候，大腦會自動把旁邊的環境雜音降低的概念

這種需要龐大資料庫跟運算力，還要有相當多資源的研究，只怕也只有Google辦得到了吧，目前Google的團隊還在計畫如何將這技術運用在Google的眾多產品中，未來除了人聲可以獲得分析，或許樂器也能夠進行分離，但像是那種只有一張圖片搭配聲音的電台式影片，目前可能就無法利用這項技術進行聲音分離惹

(新聞來源：Google)

注目! 電獺少女YouTube影音頻道熱烈訂閱中，每週最新情報整理、遊戲試玩還有手機操作教學更新，現在就訂閱電獺少女YouTube頻道，同時按下小鈴鐺才能搶先收到新片通知!

詩伊

腦袋裡充滿著夢幻的泡泡，忘記是保持樂觀的小訣竅，因為太想保持樂觀了，結果變得很健忘(咦)，如果可以的話，希望世界上充滿著快樂的笑：) 最近的願望是：如果可以的話，請把迪士尼樂園變成一個國家，讓我移民過去吧！

Facebook Instagram