~/blog/google-antigravity-2-gemini-3-5-flash-review-2026.md
AI 自動化與智慧應用 · 2026 / 06 / 12 · 3 views

Google Antigravity 2.0 與 Gemini 3.5 Flash 實測:付了七個月頂級月費,終於等到 Google 把 AI Agent 做對了

Eric — 浪花科技創辦人 / AI 架構師
Eric
浪花科技創辦人 · AI 架構師
Google Antigravity 2.0 與 Gemini 3.5 Flash 實測:付了七個月頂級月費,終於等到 Google 把 AI Agent 做對了
目錄 table-of-contents.md

2025 年 11 月 18 日 Antigravity 上線那天,我就刷卡訂了最高階的 Google AI Ultra——當時月費 NT$8,150,一年要快十萬塊。朋友聽到都說我瘋了,但理由其實很簡單:它是當時唯一能在多代理人平台上用滿頂級 Claude 模型額度的選擇,而我們公司每天都有跑不完的開發與資料任務。

七個月過去,這筆訂閱帶我坐了一輪完整的雲霄飛車:從「這是我用過最好的 AI Agent 平台」,到 quota 災難與模型斷層期的全面逃離,再到 2026 年 5 月 19 日 Google I/O 發表的 Antigravity 2.0 + Gemini 3.5 Flash——我可以負責任地說,這一次,Google 終於把 Agent 做對了。

先講 TL;DR:Antigravity 2.0 的質變不在「更聰明」,而在「快到改變你的工作方式」——同一包長任務,Claude Opus 要跑 10 分鐘,Gemini 3.5 Flash 一分鐘左右就交卷;品質上限仍然是 Opus/Fable 系列的天下,但日常資料蒐集、Office 文件批次處理、中小型修改,Flash「夠好 × 超快」的組合已經成了我的新預設。本文所有規格與價格查證於 2026 年 6 月 12 日,這個領域的價格半年能改三次,文末附上全部資料來源。

如果你是要在三大工具之間做企業選型,建議先看我們的 Antigravity、Claude Code、Codex 三大 AI Coding Agent 完整比較;這一篇則是 Antigravity 的單獨深度回顧——由一個付費七個月的重度使用者,把踩過的坑跟真香的部分一次講完。

Antigravity 1.0 的七個月:從「最好用的 AI Agent」到全面逃離

先說好的部分。2025 年 11 月 18 日隨 Gemini 3 一起發表的 Antigravity,定位從第一天就跟別人不一樣:它不是「塞在編輯器裡的助手」,而是把 agent 拉到第一層介面的任務指揮中心——agent 能直接操作編輯器、終端機與瀏覽器,而且多個並行。對當時用慣補全式工具的我來說是降維打擊。這也是我願意直上頂級方案的原因:付最貴的錢,買的其實是 Claude 系列模型在多代理平台上的高額度——從上線初期的 Sonnet 4.5,一路用到後來 Ultra 訂戶限定的 Claude Opus 4.6 (Thinking)。

但從 2026 年第一季開始,這套組合逐漸崩壞。回頭看,問題出在三個地方:

  • Quota 與穩定性災難:3 月中的 1.20.5 版更新引入新的額度管理機制後,503/429 錯誤和「額度顯示與實際用量脫鉤」成了官方論壇最大宗的抱怨:不少 Pro 甚至 Ultra 訂戶碰上動輒數天的鎖定,社群回報的實際可用額度比先前縮水了九成以上。付著頂級月費還要排隊跟撞牆,體感非常糟。
  • Gemini 3.1 系列扛不起 agent 工作:單輪能力其實不差,但放進長任務就破功——卡在無限「thinking」、跑到一半斷線,或者最氣人的:agent 迴圈跑完、回報任務完成,實際上什麼都沒做(或做錯了)。這不是我一個人的體感,gemini-cli 的 GitHub issues 與各大論壇在 2~4 月累積了大量同類回報。所以那段時間,我在 Antigravity 裡幾乎只跑 Claude 模型。
  • Claude 版本嚴重跟不上:Anthropic 今年的出貨節奏快得嚇人——4 月 16 日 Opus 4.7、5 月 28 日 Opus 4.8、6 月 9 日直接端出超越 Opus 級的 Claude Fable 5(我們的大型專案實測開箱剛出爐)。但 Antigravity 的模型清單永遠慢半拍:Opus 4.7 發布超過 24 小時後,官方論壇出現一篇標題很殺的貼文——「Antigravity 是現在唯一還沒有它的主流 AI Coding 工具」。當你看著隔壁 Claude Code 第一天就能用新模型,遷移只是時間問題。

於是 4 月底,我把主力搬到了 Claude Code(那段時間的心得散落在 Vibe Coding 架構心法台灣軟體業 AI 轉型實戰筆記兩篇裡),Antigravity 的訂閱一度只差一步就取消——直到 5 月 19 日的 Google I/O。

Antigravity 2.0 是什麼?30 秒總覽

2.0 最大的轉變:它不再是「一個 IDE」,而是一整個 agent 平台家族。官方文件把它拆成五個面向:

面向是什麼適合誰
Desktop App(新旗艦)獨立桌面應用:多 agent 並行管理、排程任務、對話與成果(artifacts)集中檢視所有人,包括非工程師
IDE原本的 agent-first 編輯器,1.0 的延續工程師日常開發
CLIGo 寫的命令列工具,把 agent 帶進終端機與 CI自動化、腳本派
SDK用程式組裝自己的 agent 系統開發 agent 產品的團隊
Managed Agents API一個 API call 拿到「agent + 託管 Linux sandbox」:支援 Bash/Python/Node、檔案、瀏覽,技能用 Markdown 定義想把 agent 嵌進自家系統的企業

發表會上最誇張的 demo,是用 93 個並行 sub-agent、一萬五千多次模型呼叫、26 億 tokens,在 12 小時內寫出一個作業系統,API 成本不到一千美元。先不論這種 demo 的實用性,它證明了 2.0 的多代理編排(orchestration)是玩真的——這正是 1.0 時代最常被詬病「並行一多就翻車」的地方。

另一個對我日常影響最大的是 Agent Skills:一個資料夾加一份 SKILL.md,就能教會 agent 一套新工作流。它是開放標準(與 Anthropic 的 skills 格式相容),社群的 skills 庫已經累積上千個現成技能——我的 Office 檔案處理流程就是這樣搭起來的,下面實測段細講。

Gemini 3.5 Flash:這次的主角是速度

Spec 與 Benchmark:用 Flash 的名字,打贏自家上一代 Pro

跟 2.0 一起發布的 Gemini 3.5 Flash,是 Google 這次「agent 優先」戰略的核心。官方公布的 agentic benchmark 數字全面壓過自家 Gemini 3.1 Pro:

項目Gemini 3.5 Flash備註
Terminal-Bench 2.1(終端機代理)76.2%官方數字,勝 Gemini 3.1 Pro
GDPval-AA(知識工作)1656 Elo官方數字
MCP Atlas(工具呼叫)83.6%官方數字
Context window1M tokens(輸出上限 65k)四檔 thinking level 可調
API 價格$1.50 / 1M 輸入、$9.00 / 1M 輸出美元計價
輸出速度官方稱比同級 frontier 模型快 4 倍;第三方實測 280+ tokens/sAntigravity 內限時以 12 倍速 serving

benchmark 數字因測試環境不同常有出入,這裡以官方發布值為準、來源附於文末——重點不是小數點,而是趨勢:一顆「Flash」定位的模型,在 agent 任務上打贏了上一代旗艦。對照 TechCrunch 的觀察,Google 這波押注非常明確:下一階段的競爭不在聊天機器人,在代理人。

Claude 跑 10 分鐘的任務,Flash 一分鐘交卷:4 倍速是什麼概念

數字講完,講體感。我最常跑的一類任務是「搜尋多個來源 → 交叉比對 → 彙整成結構化報告」,在 Claude Code 上用 Opus 跑,平均 10 分鐘上下;同樣的任務丟給 Antigravity 2.0 + Gemini 3.5 Flash,一分鐘出頭就跑完。官方說 4 倍、Antigravity 限時 12 倍速 serving,我的體感大概落在 8~10 倍——已經快到改變工作模式:以前送出任務會切去做別的事,現在我會「等它」,因為等的成本比切換上下文還低。

更重要的是長任務不再裝死。3.1 時代那種「跑完迴圈、宣稱完成、實際沒做」的災難,在我這三週多的使用裡幾乎沒再出現——該改的檔案真的改了、該跑的驗證真的跑了。這是質的飛躍,不是百分比的進步。

API 價格:快,但不便宜

潑一盆冷水:3.5 Flash 的 API 定價($1.50/$9.00 per 1M tokens)比上一代 Flash 貴了一大截,第三方估算實際跑起來(含 thinking tokens)比 Gemini 3.1 Pro 還貴約 75%。訂閱制用戶無感,但如果你是要接 API 做產品,「Flash = 便宜」的舊印象要更新了——它現在是「速度檔」,不是「省錢檔」。

三週實測心得:哪些工作交給 Flash,哪些留給 Opus

從 I/O 至今三週多,我的工作流大致收斂成這樣的分工:

  • 日常資料蒐集與比對 → Flash,真香。市場調查、競品價格比對、多來源交叉查證這類「廣而淺」的任務,Flash 一分鐘等級的回合時間讓你可以連發十次修正指令也不心疼。我們做 AEO/GEO 內容稽核時的資料蒐集,現在預設都丟給它。
  • Office 檔案批次處理 → Flash + Skills,意外的殺手級組合。透過 office 類 Agent Skills 加上 sandbox 裡的 Python,修改 Word 合約條款、重算 Excel 報價表、批次改 PowerPoint 模板,又快又穩。對非工程師同事來說,Desktop App + Skills 可能比 IDE 本體更有價值——這塊我們之後會寫一篇專文。
  • 中小型程式修改、跑測試、改文案 → Flash 夠用。改個 API 欄位、補測試、調整頁面文案這種「看得到底」的任務,用 Opus 是殺雞用牛刀。
  • 架構設計、大規模重構、品質敏感的程式碼 → 還是 Opus 4.8/Fable 5。品質的天花板目前仍在 Anthropic 手上:複雜依賴的重構、需要全案視野的架構決策,Flash 給出的方案明顯比較淺。速度可以買時間,買不到判斷力。
  • 一個提醒:速度快,犯錯也快。agent 一分鐘能做完的事,也代表一分鐘能弄壞。權限護欄與審核流程要先架好——我們在那次 AI 代理人搞掛客戶資料庫之後學到的護欄心法AI 代理人監督模式兩篇有完整作法。

Google AI 訂閱方案總表(台灣價格,2026 年 6 月查證)

I/O 之後 Google 也把訂閱方案大改了一輪:頂級方案降價、新增一個中間檔,計費並逐步走向「算力消耗制」。台灣價格如下(查證於 2026 年 6 月 12 日,變動很快,下手前請以官方訂閱頁為準):

方案月費(台灣)額度Antigravity 相關權益
Google AI PlusNT$165免費版 2 倍—(無 Antigravity 權益)
Google AI ProNT$650免費版 4 倍可用 Antigravity,輕度使用入門
Google AI Ultra(入門檔,新)NT$3,300Pro 的 5 倍Gemini 3.5 Flash 優先存取、20TB 空間
Google AI Ultra(頂級檔)NT$6,500(原 NT$8,150)Pro 的 20 倍以上最高 agent 模型額度,Claude Opus 4.6 (Thinking) 等頂級模型額度拉滿

身為從 NT$8,150 一路付過來的老訂戶,看到降價當然五味雜陳,但平心而論:新的 NT$3,300 檔是這次改版的甜蜜點——「想要 Flash 的速度 + Antigravity 2.0 的完整體驗,但不需要 20 倍額度」的人,入門檔就夠了。要注意的是 Claude Opus 級模型的高額度仍是頂級檔限定,而且 Antigravity 上的 Claude 版本目前停在 4.6——比 Anthropic 自家最新版落後兩個世代。

情境選型指南(Use Case × 模型 × 方案)

日常資料蒐集、文件處理、行政自動化 → Flash + Ultra 入門檔

NT$3,300 的入門 Ultra 配 Gemini 3.5 Flash,是目前「非開發類 agent 工作」CP 值最高的組合。如果你的需求更偏固定流程的串接(而不是開放式任務),先看看 n8n、Make、Zapier 的比較,工作流工具可能更便宜。

軟體團隊的主力開發 → Claude Code 為主、Antigravity 為輔

品質敏感的核心開發,模型品質就是一切,Opus 4.8/Fable 5 目前仍是天花板,而 Claude Code 永遠第一天拿到新模型。Antigravity 拿來跑資料任務與前端驗證,雙刀流不衝突。完整比較見我們的三大工具選型指南

前端密集、需要瀏覽器自動驗證 → Antigravity 2.0

內建瀏覽器操作與截圖驗證仍是 Antigravity 的獨門優勢,配上 Flash 的速度,「改完 → 自己開瀏覽器檢查 → 修正」的迴圈快得驚人。

非工程師的知識工作者 → Desktop App + Skills

不用碰終端機,裝好 Desktop App、掛上 office 類 skills,就能把報表、合約、簡報的重複工作交給 agent。這是 2.0 真正打開的新客群。

預算有限的觀望者 → Pro 檔先試水溫

NT$650 就能體驗完整的 Antigravity 2.0 + Flash,輕度使用其實夠用;等撞到額度牆再升級也不遲。

結論:等 Gemini 3.5 Pro 端出什麼菜

I/O 現場最大的懸念,是 Sundar Pichai 那句「再給我們一個月」——Gemini 3.5 Pro 在 keynote 上只聞樓梯響,外媒推估 6 月下旬上線,已知的賣點是 2M token context 與 Deep Think 推理模式

我的判斷很直接:如果 3.5 Pro 能把 Flash 這套「長任務不裝死 + 速度經濟學」帶到 Opus 級的品質,AI Coding Agent 的牌桌就要重洗一次——屆時「品質選 Anthropic、速度選 Google」的二分法會被打破。但 Anthropic 也沒閒著,Fable 5 才剛把品質天花板又抬高了一截(實測在這)。身為兩邊都付錢的用戶,這種軍備競賽我樂見其成:我的 Ultra 訂閱會留著等 3.5 Pro 開箱,到時候再寫一篇完整對決。

如果你的公司正在評估怎麼把這些 agent 工具落地成實際的流程自動化——從選型、權限護欄到跟既有系統串接——這正是我們每天在做的事,歡迎找我們聊聊你的場景。

資料來源與延伸連結

本文所有規格、價格與日期均於 2026 年 6 月 12 日逐一查證;價格與額度政策變動頻繁,請以官方頁面為準。

延伸閱讀:

// FAQ

常見問題

Antigravity 2.0 是免費的嗎?需要訂閱哪個方案?
平台本身在 preview 期間免費下載使用,但模型額度跟 Google AI 訂閱綁定:輕度使用 Google AI Pro(NT$650/月)即可入門;重度使用建議 AI Ultra,入門檔 NT$3,300/月(Pro 的 5 倍額度)或頂級檔 NT$6,500/月(Pro 的 20 倍以上)。Claude Opus 4.6 (Thinking) 的高額度為頂級 Ultra 訂戶限定。價格查證於 2026 年 6 月,請以官方頁面為準。
Gemini 3.5 Flash 跟 Claude Opus 4.8,該用哪一個?
看任務性質。Gemini 3.5 Flash 的優勢是速度(官方稱快 4 倍,Antigravity 內限時 12 倍速 serving),適合資料蒐集、文件批次處理、中小型修改這類高頻任務;Claude Opus 4.8/Fable 5 的品質上限更高,架構設計、大規模重構、品質敏感的程式碼仍建議用 Claude。實務上最好的解法是混搭分工。
Antigravity 2.0 可以處理 Word、Excel、PowerPoint 檔案嗎?
可以。透過 Agent Skills(開放的 SKILL.md 標準)搭配 Managed Agents 的 Linux sandbox(支援 Bash/Python/Node),agent 能直接讀寫與批次修改 Office 文件;社群 skills 庫已有上千個現成技能,包含 office-productivity 類別。搭配 Gemini 3.5 Flash 的速度,是非工程師也能上手的自動化方案。
Gemini 3.5 Pro 什麼時候推出?會有什麼功能?
Google 在 2026 年 5 月 19 日的 I/O 上宣布了 Gemini 3.5 Pro 但延後發布,執行長 Pichai 承諾「一個月內」推出,外媒推估 6 月下旬上線。已公開的重點規格包括 2M token context window 與 Deep Think 推理模式。
#Google Antigravity #Gemini 3.5 Flash #AI Coding Agent #Gemini 3.5 Pro #Claude Opus #AI 開發工具
~/roamer-tech/newsletter // FREE
// newsletter

訂閱免費電子報

把 AI 自動化、企業系統設計與 WordPress / Laravel 開發的真實案例和可直接照做的技巧,整理成電子報寄給你。只寄精選內容、不灌垃圾信,一鍵就能退訂。

$
// final.exec()

準備好讓你的網站開始為你工作了嗎?