出國旅行、跨國會議,甚至只是向外國人問個路,語言往往都是最大的溝通門檻,雖然翻譯 App 已經相當普及,但過去多數工具仍需要等一句話說完後才能開始翻譯,讓對話過程不免出現停頓,Google 近期推出全新的 Gemini 3.5 Live Translate 模型,希望讓翻譯變得更接近真人口譯,不只縮短等待時間,還能在翻譯過程中保留原本說話者的語氣與節奏,讓跨語言交流變得更加自然

(圖片來源:Google)
從逐句翻譯走向同步口譯,減少對話停頓感
傳統語音翻譯最大的限制,就是雙方必須輪流等待翻譯結果出現,對話節奏容易被切割得支離破碎,Gemini 3.5 Live Translate 則改變了這種模式,系統能在聆聽內容的同時開始生成翻譯語音,盡量讓翻譯與原始發言同步進行,Google 表示,模型會在翻譯品質與回應速度之間持續調整平衡,在蒐集足夠語意資訊的同時,盡可能快速輸出譯文,因此使用者聽到的翻譯通常只會比原本發言慢上幾秒鐘,整體感受更接近真人即時口譯

(圖片來源:Google)
不只翻譯文字,也試圖保留說話者的表達方式
除了追求低延遲之外,Google 這次也希望讓翻譯保留更多人與人溝通時的重要細節,過去機器翻譯生成的語音常常缺乏情感變化,無論原本說話者是興奮、急促還是平靜,最後聽起來都像同一種語調,Gemini 3.5 Live Translate 則會嘗試保留說話時的音高、節奏與語氣,讓翻譯後的內容不只是傳達意思,也能呈現部分說話氛圍,進一步提升交流的真實感

(圖片來源:Google AI)
支援超過 70 種語言,Google Meet 與翻譯 App 都將受惠
語言支援範圍也是這次更新的重要亮點之一,目前 Gemini 3.5 Live Translate 已支援超過 70 種語言,並能形成超過 2,000 種語言配對組合,這項技術未來將陸續導入 Google 旗下多項服務,其中 Google Meet 的即時翻譯功能將迎來大幅升級,不再只圍繞英語進行翻譯,而是能夠讓多種語言直接互相轉換,同時會議介面也將新增更直覺的翻譯設定選項,方便使用者快速開啟與管理相關功能,對一般消費者而言,Google Translate App 則是最容易接觸到的新功能入口,Android 與 iPhone 用戶都能透過 Live Translate 功能進行即時跨語言對話

(圖片來源:Google AI)
行動裝置加入新玩法,翻譯體驗更貼近日常使用
除了基本的即時翻譯之外,Google 也針對手機使用情境做出調整,當使用者搭配耳機使用時,可以直接聆聽翻譯後的語音內容,而 Android 平台更新增了類似通話的「聽講模式」,只要把手機貼近耳邊,就能透過聽筒接收翻譯結果,不需要開啟擴音,也不一定要配戴耳機,這樣的設計在旅遊導覽、現場諮詢或公共場合中特別實用,不僅能降低對周圍環境的干擾,也能保有較高的隱私性

(圖片來源:Unsplash)
AI 翻譯能力提升,同時也強化內容辨識機制
隨著 AI 生成語音品質越來越逼真,外界也開始關注假音訊與深偽內容帶來的風險,為此 Google 表示所有由 Gemini 產生的音訊內容都將加入 SynthID 數位浮水印技術,相關資訊會被嵌入音訊之中,方便後續進行辨識與驗證,降低生成內容被濫用的可能性

(圖片來源:Unsplash)
小結
即時翻譯技術發展多年,如今正逐漸從單純的文字轉換工具,走向更接近真人口譯的互動模式,Gemini 3.5 Live Translate 的重點不只是支援更多語言,而是在速度、自然度與使用情境之間找到新的平衡點,無論是出國旅遊、跨國工作,還是日常與不同語言使用者交流,這類工具都正在降低語言帶來的隔閡,當然,面對專業術語、複雜語境或特殊口音時,翻譯品質仍有進一步提升空間,但從目前的發展方向來看,即時語音翻譯已經逐漸從新技術變成未來數位溝通的重要基礎設施ฅ^•ﻌ•^ฅ
🌟電獺少女也有 TikTok 了!各類 App 使用密技、即時科技大事、第一手產品把玩心得全都在電獺少女 TikTok 就差你沒關注啦!