Google 在本週正式推出 Gemini 2.0,是 Google 目前功能最強大的 AI 模型,繼 Gemini 1.0 和 1.5 在多模態和長篇幅文本的理解,有一定的進展之後,Gemini 2.0 原生具備代理能力,替 AI 應用帶來全新可能性,究竟 Gemini 2.0 的理解和推理能力有多強大,以下一起來快速看看
Gemini 2.0 系列中 Gemini 2.0 Flash 實驗性質的模型,在本週四(12/12)開始,開放給所有 Gemini 使用者和開發者:Gemini 使用者可以透過桌面和行動網頁版體驗,開發者則能透過 Google AI Studio 和 Vertex AI 使用。此外,Gemini 2.0 也會提升 Google 搜尋 AI 摘要還有更多產品的功能,帶來更強大的推理能力,處理更複雜的主題和多層次的問題
Gemini 2.0 Flash 除了支援圖形、影片和音訊等多模態輸入之外,2.0 Flash 現在還支援多模態輸出,例如:原生地同時生成圖形、文字,還有從文字轉成語音、可調整的多語言音訊。能夠直接呼叫 Google 搜尋、執行程式碼,以及使用者自定義的第三方工具
從本週四開始,全球的 Gemini 用戶都可以透過桌面和行動網頁版的模型下拉式功能表,選取能提升對話品質的 2.0 Flash 實驗版本,而 Gemini 2.0 也預計從明年初開始,擴展到更多 Google 的產品上,像是會在 AI 智慧助理「Project Astra」中,提供更流暢的對話和更厲害的記憶力,同時降低延遲性
Gemini 2.0 也能在「Project Mariner」上,可以幫助你完成更複雜任務,還能你在電玩遊戲的虛擬世界中導航,在你玩遊戲時,根據螢幕上的動作來推理遊戲,並在即時對話中提供下一步操作的建議,目前 Google 正在和 Supercell 等遊戲開發者合作,探索這些代理的運作方法,測試它們在各種遊戲中解釋規則和挑戰的能力,從「部落衝突」等策略遊戲到「卡通農場」等模擬經營遊戲,未來都有機會用得到
(新聞來源:Google 新聞稿)
電獺少女 LINE 官方帳號好友募集中!精選每日科技新聞和促咪事件,還有各類 App 的密技心得,就差你沒加!