Google Antigravity 2.0 與 Gemini 3.5 Flash 實測:付了七個月頂級月費,終於等到 Google 把 AI Agent 做對了
☰ 目錄 table-of-contents.md
2025 年 11 月 18 日 Antigravity 上線那天,我就刷卡訂了最高階的 Google AI Ultra——當時月費 NT$8,150,一年要快十萬塊。朋友聽到都說我瘋了,但理由其實很簡單:它是當時唯一能在多代理人平台上用滿頂級 Claude 模型額度的選擇,而我們公司每天都有跑不完的開發與資料任務。
七個月過去,這筆訂閱帶我坐了一輪完整的雲霄飛車:從「這是我用過最好的 AI Agent 平台」,到 quota 災難與模型斷層期的全面逃離,再到 2026 年 5 月 19 日 Google I/O 發表的 Antigravity 2.0 + Gemini 3.5 Flash——我可以負責任地說,這一次,Google 終於把 Agent 做對了。
先講 TL;DR:Antigravity 2.0 的質變不在「更聰明」,而在「快到改變你的工作方式」——同一包長任務,Claude Opus 要跑 10 分鐘,Gemini 3.5 Flash 一分鐘左右就交卷;品質上限仍然是 Opus/Fable 系列的天下,但日常資料蒐集、Office 文件批次處理、中小型修改,Flash「夠好 × 超快」的組合已經成了我的新預設。本文所有規格與價格查證於 2026 年 6 月 12 日,這個領域的價格半年能改三次,文末附上全部資料來源。
如果你是要在三大工具之間做企業選型,建議先看我們的 Antigravity、Claude Code、Codex 三大 AI Coding Agent 完整比較;這一篇則是 Antigravity 的單獨深度回顧——由一個付費七個月的重度使用者,把踩過的坑跟真香的部分一次講完。
Antigravity 1.0 的七個月:從「最好用的 AI Agent」到全面逃離
先說好的部分。2025 年 11 月 18 日隨 Gemini 3 一起發表的 Antigravity,定位從第一天就跟別人不一樣:它不是「塞在編輯器裡的助手」,而是把 agent 拉到第一層介面的任務指揮中心——agent 能直接操作編輯器、終端機與瀏覽器,而且多個並行。對當時用慣補全式工具的我來說是降維打擊。這也是我願意直上頂級方案的原因:付最貴的錢,買的其實是 Claude 系列模型在多代理平台上的高額度——從上線初期的 Sonnet 4.5,一路用到後來 Ultra 訂戶限定的 Claude Opus 4.6 (Thinking)。
但從 2026 年第一季開始,這套組合逐漸崩壞。回頭看,問題出在三個地方:
- Quota 與穩定性災難:3 月中的 1.20.5 版更新引入新的額度管理機制後,503/429 錯誤和「額度顯示與實際用量脫鉤」成了官方論壇最大宗的抱怨:不少 Pro 甚至 Ultra 訂戶碰上動輒數天的鎖定,社群回報的實際可用額度比先前縮水了九成以上。付著頂級月費還要排隊跟撞牆,體感非常糟。
- Gemini 3.1 系列扛不起 agent 工作:單輪能力其實不差,但放進長任務就破功——卡在無限「thinking」、跑到一半斷線,或者最氣人的:agent 迴圈跑完、回報任務完成,實際上什麼都沒做(或做錯了)。這不是我一個人的體感,gemini-cli 的 GitHub issues 與各大論壇在 2~4 月累積了大量同類回報。所以那段時間,我在 Antigravity 裡幾乎只跑 Claude 模型。
- Claude 版本嚴重跟不上:Anthropic 今年的出貨節奏快得嚇人——4 月 16 日 Opus 4.7、5 月 28 日 Opus 4.8、6 月 9 日直接端出超越 Opus 級的 Claude Fable 5(我們的大型專案實測開箱剛出爐)。但 Antigravity 的模型清單永遠慢半拍:Opus 4.7 發布超過 24 小時後,官方論壇出現一篇標題很殺的貼文——「Antigravity 是現在唯一還沒有它的主流 AI Coding 工具」。當你看著隔壁 Claude Code 第一天就能用新模型,遷移只是時間問題。
於是 4 月底,我把主力搬到了 Claude Code(那段時間的心得散落在 Vibe Coding 架構心法和 台灣軟體業 AI 轉型實戰筆記兩篇裡),Antigravity 的訂閱一度只差一步就取消——直到 5 月 19 日的 Google I/O。
Antigravity 2.0 是什麼?30 秒總覽
2.0 最大的轉變:它不再是「一個 IDE」,而是一整個 agent 平台家族。官方文件把它拆成五個面向:
| 面向 | 是什麼 | 適合誰 |
|---|---|---|
| Desktop App(新旗艦) | 獨立桌面應用:多 agent 並行管理、排程任務、對話與成果(artifacts)集中檢視 | 所有人,包括非工程師 |
| IDE | 原本的 agent-first 編輯器,1.0 的延續 | 工程師日常開發 |
| CLI | Go 寫的命令列工具,把 agent 帶進終端機與 CI | 自動化、腳本派 |
| SDK | 用程式組裝自己的 agent 系統 | 開發 agent 產品的團隊 |
| Managed Agents API | 一個 API call 拿到「agent + 託管 Linux sandbox」:支援 Bash/Python/Node、檔案、瀏覽,技能用 Markdown 定義 | 想把 agent 嵌進自家系統的企業 |
發表會上最誇張的 demo,是用 93 個並行 sub-agent、一萬五千多次模型呼叫、26 億 tokens,在 12 小時內寫出一個作業系統,API 成本不到一千美元。先不論這種 demo 的實用性,它證明了 2.0 的多代理編排(orchestration)是玩真的——這正是 1.0 時代最常被詬病「並行一多就翻車」的地方。
另一個對我日常影響最大的是 Agent Skills:一個資料夾加一份 SKILL.md,就能教會 agent 一套新工作流。它是開放標準(與 Anthropic 的 skills 格式相容),社群的 skills 庫已經累積上千個現成技能——我的 Office 檔案處理流程就是這樣搭起來的,下面實測段細講。
Gemini 3.5 Flash:這次的主角是速度
Spec 與 Benchmark:用 Flash 的名字,打贏自家上一代 Pro
跟 2.0 一起發布的 Gemini 3.5 Flash,是 Google 這次「agent 優先」戰略的核心。官方公布的 agentic benchmark 數字全面壓過自家 Gemini 3.1 Pro:
| 項目 | Gemini 3.5 Flash | 備註 |
|---|---|---|
| Terminal-Bench 2.1(終端機代理) | 76.2% | 官方數字,勝 Gemini 3.1 Pro |
| GDPval-AA(知識工作) | 1656 Elo | 官方數字 |
| MCP Atlas(工具呼叫) | 83.6% | 官方數字 |
| Context window | 1M tokens(輸出上限 65k) | 四檔 thinking level 可調 |
| API 價格 | $1.50 / 1M 輸入、$9.00 / 1M 輸出 | 美元計價 |
| 輸出速度 | 官方稱比同級 frontier 模型快 4 倍;第三方實測 280+ tokens/s | Antigravity 內限時以 12 倍速 serving |
benchmark 數字因測試環境不同常有出入,這裡以官方發布值為準、來源附於文末——重點不是小數點,而是趨勢:一顆「Flash」定位的模型,在 agent 任務上打贏了上一代旗艦。對照 TechCrunch 的觀察,Google 這波押注非常明確:下一階段的競爭不在聊天機器人,在代理人。
Claude 跑 10 分鐘的任務,Flash 一分鐘交卷:4 倍速是什麼概念
數字講完,講體感。我最常跑的一類任務是「搜尋多個來源 → 交叉比對 → 彙整成結構化報告」,在 Claude Code 上用 Opus 跑,平均 10 分鐘上下;同樣的任務丟給 Antigravity 2.0 + Gemini 3.5 Flash,一分鐘出頭就跑完。官方說 4 倍、Antigravity 限時 12 倍速 serving,我的體感大概落在 8~10 倍——已經快到改變工作模式:以前送出任務會切去做別的事,現在我會「等它」,因為等的成本比切換上下文還低。
更重要的是長任務不再裝死。3.1 時代那種「跑完迴圈、宣稱完成、實際沒做」的災難,在我這三週多的使用裡幾乎沒再出現——該改的檔案真的改了、該跑的驗證真的跑了。這是質的飛躍,不是百分比的進步。
API 價格:快,但不便宜
潑一盆冷水:3.5 Flash 的 API 定價($1.50/$9.00 per 1M tokens)比上一代 Flash 貴了一大截,第三方估算實際跑起來(含 thinking tokens)比 Gemini 3.1 Pro 還貴約 75%。訂閱制用戶無感,但如果你是要接 API 做產品,「Flash = 便宜」的舊印象要更新了——它現在是「速度檔」,不是「省錢檔」。
三週實測心得:哪些工作交給 Flash,哪些留給 Opus
從 I/O 至今三週多,我的工作流大致收斂成這樣的分工:
- 日常資料蒐集與比對 → Flash,真香。市場調查、競品價格比對、多來源交叉查證這類「廣而淺」的任務,Flash 一分鐘等級的回合時間讓你可以連發十次修正指令也不心疼。我們做 AEO/GEO 內容稽核時的資料蒐集,現在預設都丟給它。
- Office 檔案批次處理 → Flash + Skills,意外的殺手級組合。透過 office 類 Agent Skills 加上 sandbox 裡的 Python,修改 Word 合約條款、重算 Excel 報價表、批次改 PowerPoint 模板,又快又穩。對非工程師同事來說,Desktop App + Skills 可能比 IDE 本體更有價值——這塊我們之後會寫一篇專文。
- 中小型程式修改、跑測試、改文案 → Flash 夠用。改個 API 欄位、補測試、調整頁面文案這種「看得到底」的任務,用 Opus 是殺雞用牛刀。
- 架構設計、大規模重構、品質敏感的程式碼 → 還是 Opus 4.8/Fable 5。品質的天花板目前仍在 Anthropic 手上:複雜依賴的重構、需要全案視野的架構決策,Flash 給出的方案明顯比較淺。速度可以買時間,買不到判斷力。
- 一個提醒:速度快,犯錯也快。agent 一分鐘能做完的事,也代表一分鐘能弄壞。權限護欄與審核流程要先架好——我們在那次 AI 代理人搞掛客戶資料庫之後學到的護欄心法和 AI 代理人監督模式兩篇有完整作法。
Google AI 訂閱方案總表(台灣價格,2026 年 6 月查證)
I/O 之後 Google 也把訂閱方案大改了一輪:頂級方案降價、新增一個中間檔,計費並逐步走向「算力消耗制」。台灣價格如下(查證於 2026 年 6 月 12 日,變動很快,下手前請以官方訂閱頁為準):
| 方案 | 月費(台灣) | 額度 | Antigravity 相關權益 |
|---|---|---|---|
| Google AI Plus | NT$165 | 免費版 2 倍 | —(無 Antigravity 權益) |
| Google AI Pro | NT$650 | 免費版 4 倍 | 可用 Antigravity,輕度使用入門 |
| Google AI Ultra(入門檔,新) | NT$3,300 | Pro 的 5 倍 | Gemini 3.5 Flash 優先存取、20TB 空間 |
| Google AI Ultra(頂級檔) | NT$6,500(原 NT$8,150) | Pro 的 20 倍以上 | 最高 agent 模型額度,Claude Opus 4.6 (Thinking) 等頂級模型額度拉滿 |
身為從 NT$8,150 一路付過來的老訂戶,看到降價當然五味雜陳,但平心而論:新的 NT$3,300 檔是這次改版的甜蜜點——「想要 Flash 的速度 + Antigravity 2.0 的完整體驗,但不需要 20 倍額度」的人,入門檔就夠了。要注意的是 Claude Opus 級模型的高額度仍是頂級檔限定,而且 Antigravity 上的 Claude 版本目前停在 4.6——比 Anthropic 自家最新版落後兩個世代。
情境選型指南(Use Case × 模型 × 方案)
日常資料蒐集、文件處理、行政自動化 → Flash + Ultra 入門檔
NT$3,300 的入門 Ultra 配 Gemini 3.5 Flash,是目前「非開發類 agent 工作」CP 值最高的組合。如果你的需求更偏固定流程的串接(而不是開放式任務),先看看 n8n、Make、Zapier 的比較,工作流工具可能更便宜。
軟體團隊的主力開發 → Claude Code 為主、Antigravity 為輔
品質敏感的核心開發,模型品質就是一切,Opus 4.8/Fable 5 目前仍是天花板,而 Claude Code 永遠第一天拿到新模型。Antigravity 拿來跑資料任務與前端驗證,雙刀流不衝突。完整比較見我們的三大工具選型指南。
前端密集、需要瀏覽器自動驗證 → Antigravity 2.0
內建瀏覽器操作與截圖驗證仍是 Antigravity 的獨門優勢,配上 Flash 的速度,「改完 → 自己開瀏覽器檢查 → 修正」的迴圈快得驚人。
非工程師的知識工作者 → Desktop App + Skills
不用碰終端機,裝好 Desktop App、掛上 office 類 skills,就能把報表、合約、簡報的重複工作交給 agent。這是 2.0 真正打開的新客群。
預算有限的觀望者 → Pro 檔先試水溫
NT$650 就能體驗完整的 Antigravity 2.0 + Flash,輕度使用其實夠用;等撞到額度牆再升級也不遲。
結論:等 Gemini 3.5 Pro 端出什麼菜
I/O 現場最大的懸念,是 Sundar Pichai 那句「再給我們一個月」——Gemini 3.5 Pro 在 keynote 上只聞樓梯響,外媒推估 6 月下旬上線,已知的賣點是 2M token context 與 Deep Think 推理模式。
我的判斷很直接:如果 3.5 Pro 能把 Flash 這套「長任務不裝死 + 速度經濟學」帶到 Opus 級的品質,AI Coding Agent 的牌桌就要重洗一次——屆時「品質選 Anthropic、速度選 Google」的二分法會被打破。但 Anthropic 也沒閒著,Fable 5 才剛把品質天花板又抬高了一截(實測在這)。身為兩邊都付錢的用戶,這種軍備競賽我樂見其成:我的 Ultra 訂閱會留著等 3.5 Pro 開箱,到時候再寫一篇完整對決。
如果你的公司正在評估怎麼把這些 agent 工具落地成實際的流程自動化——從選型、權限護欄到跟既有系統串接——這正是我們每天在做的事,歡迎找我們聊聊你的場景。
資料來源與延伸連結
本文所有規格、價格與日期均於 2026 年 6 月 12 日逐一查證;價格與額度政策變動頻繁,請以官方頁面為準。
- Google 官方:Gemini 3.5 — frontier intelligence with action
- Antigravity 2.0 官方文件(Overview)
- Antigravity Agent Skills 官方文件
- Google Developers Blog:Antigravity 初代發表(2025/11)
- TechCrunch:Google bets its next AI wave on agents, not chatbots
- Latent Space:Google I/O 2026 技術整理
- Wikipedia:Google Antigravity(版本沿革)
- Google AI 訂閱方案(台灣官方頁)
- 數位時代:Google AI 訂閱方案大更新、算力消耗制
- T客邦:AI Ultra 每月 3,300 元新檔位
- Anthropic 官方:Introducing Claude Opus 4.8
- TechCrunch:Anthropic releases Opus 4.8
- Google AI 開發者論壇:Opus 4.7 缺席討論串
- gemini-cli GitHub:Gemini 3.1 Pro 長任務卡死 issue
- Tech Times:Gemini 3.5 Pro 六月上線預測
延伸閱讀:
常見問題
Antigravity 2.0 是免費的嗎?需要訂閱哪個方案?
Gemini 3.5 Flash 跟 Claude Opus 4.8,該用哪一個?
Antigravity 2.0 可以處理 Word、Excel、PowerPoint 檔案嗎?
Gemini 3.5 Pro 什麼時候推出?會有什麼功能?
訂閱免費電子報
把 AI 自動化、企業系統設計與 WordPress / Laravel 開發的真實案例和可直接照做的技巧,整理成電子報寄給你。只寄精選內容、不灌垃圾信,一鍵就能退訂。