Google 一年一度的 I/O 大會正如火如荼展開,眾所矚目的最新 AI 模型 Gemini 3.5 也一同亮相,並正式預告世界將迎來真正具行動力的 AI。Gemini 3.5 的核心設計理念,正式將「尖端智慧」與「行動力」完美結合,專注於強化代理程式編寫(agentic coding)、長週期任務,以及解決真實世界的工作流程與問題。此系列目前包含 2 款模型,包括首發的 Gemini 3.5 Flash 以及即將推出的 Gemini 3.5 Pro。除了 Gemini 3.5 系列之外,Google 也發表了較為特別的 Gemini Omni。
又快又聰明的模型真的存在嗎?Google 端出 Gemini 3.5 Flash
Gemini 3.5 Flash 是此次 Google I/O 主打的模型,打破了以往「高智能要以低速度作為犧牲」的限制,在「智慧能力」與「輸出速度」的對比象限中,是唯一落在右上角(兩者皆高)的模型,勝過 OpenAI 的 GPT-5.5(xhigh)以及 Anthropic 的 Claude Opus 4.7(max)等模型。
效能
在幾乎所有的基準測試中,Gemini 3.5 Flash 的表現都超越了上一代的尖端模型 3.1 Pro。它在程式編寫能力,以及「GDP val」(一項衡量真實世界中具經濟價值任務的指標)上亦取得了極大的進展。
速度
在處理速度方面,3.5 Flash 的輸出速度(每秒生成 Token 數)比其他前沿模型快了 4 倍,若結合 Google 的代理開發平台 Antigravity 運行最佳化版本,更可以在維持品質的前提下,達到 12 倍快的速度。
AI 代理與自主多功能力
Gemini 3.5 Flash 的長處在於同時部署多個 AI 代理,並完成長時間運行的任務,能自主處理多重對話、獨立執行 coding pipelines,並且管理反覆迭代的專案研究。
Google 分享,在內部測試中,甚至曾成功讓代理程式完全從零開始,建立一個可實際運作的作業系統(OS)。
價格
Gemini 3.5 Flash 在價格上也極具競爭力。Google 指出,對於每天處理 1 兆個 Token 的頂尖企業而言,若將 80% 的工作轉移到 3.5 Flash,每年可節省超過 10 億美元的成本。
這些 Google 產品都已套用 Gemini 3.5 Flash
現在,包括月活躍使用者突破 10 億人的 AI Mode、在搜尋中即時生成互動式視覺小工具(Generative UI)的功能、此次發表的 24 小時全天候運作的個人 AI 代理 Gemini Spark、最新的代理開發平台 Antigravity 2.0 都已使用 Gemini 3.5 Flash 作為底層引擎。
(Google 此次全新推出的 Gemini Spark《INSIDE》將於另一篇文章中專文介紹:Gemini Spark 來了!有一個 24/7 主動式 AI 助理是什麼概念?)
Gemini 3.5 Pro 下個月就到
此次除了 Flash 版,Google 也「預告」了進階版的 Gemini 3.5 Pro,該模型預計將在下個月(6 月)正式推出。
Gemini Omni 是什麼?邁向「世界模型」的下一步
此次 Google 也宣布了一個相當特別的模型 Gemini Omni,其具備原生的多模態輸入與輸出能力,讓 AI 可從「預測文字」進化至「模擬現實」。
Google 在介紹 Gemini Omni 時十分耐人尋味地表示,Gemini Omni 能從任何形式的輸入內容(圖片、文字、影片、音訊),來生成任何形式的結果,「首先從影片(形式)開始」(starting with video)。
由於結合了 Gemini 的推理與創造能力,使用者可以直接上傳影片,並用語音、圖像或文字提示來改變影片中的角色、細節或風格,Gemini Omni 模型便會運用高階的實體世界知識邏輯來進行合理修改。
例如,當使用者給予「蛋白質摺疊的黏土動畫解說」這種簡單提示時,它能生成符合科學事實且風格一致的動態影片。也就是說,人們將可以做到「用嘴編輯影片」,只要使用自然語言(且每個指令都建立在之前的指令上),就能順利編輯影片內容。
有趣的是,隨著 Gemini Omni 整合進 Gemini 應用程式,使用者將可以輕鬆上傳相機圖庫中的照片或影片,只需點擊套用內建模板,就能打造出一個外觀和聲音都與自己極為相似的自訂 AI 虛擬分身(avatar)。
首發版本 Gemini Omni Flash 將開放給 Google AI 訂閱者使用,可於 Gemini 應用程式、Google Flow 中使用,對於 YouTube Shorts 以及 YouTube Create app 使用者來說也可免費使用 。Google 並預告未來還會推出更強大的 Gemini Omni Pro 版本。
另,在未來幾週內,Google 將會透過 API,將 Omni 的功能陸續提供給開發者與企業客戶使用。
加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員。