~/blog/google-antigravity-2-gemini-3-5-flash-review-2026.md

AI 自動化與智慧應用 · 2026 / 06 / 12 · 更新於 2026 / 07 / 24

Google Antigravity 2.0 與 Gemini 3.5 Flash 實測：付了七個月頂級月費，終於等到 Google 把 AI Agent 做對了

Eric

浪花科技創辦人 · AI 架構師

Google Antigravity 2.0 與 Gemini 3.5 Flash 實測：付了七個月頂級月費，終於等到 Google 把 AI Agent 做對了

☰ 目錄 table-of-contents.md

2025 年 11 月 18 日 Antigravity 上線那天，我就刷卡訂了最高階的 Google AI Ultra，當時月費 NT$8,150，一年要快十萬塊。朋友聽到都說我瘋了，但理由其實很簡單：它是當時唯一能在多代理人平台上用滿頂級 Claude 模型額度的選擇，而我們公司每天都有跑不完的開發與資料任務。

七個月過去，這筆訂閱帶我坐了一輪完整的雲霄飛車：從「這是我用過最好的 AI Agent 平台」，到 quota 災難與模型斷層期的全面逃離，再到 2026 年 5 月 19 日 Google I/O 發表的 Antigravity 2.0 + Gemini 3.5 Flash，我可以負責任地說，這一次，Google 終於把 Agent 做對了。

先講 Antigravity 2.0 的質變不在「更聰明」，而在「快到改變你的工作方式」，同一包長任務，Claude Opus 要跑 10 分鐘，Gemini 3.5 Flash 一分鐘左右就交卷；品質上限仍然是 Opus／Fable 系列的天下，但日常資料蒐集、Office 文件批次處理、中小型修改，Flash「夠好 × 超快」的組合已經成了我的新預設。本文所有規格與價格查證於 2026 年 6 月 12 日，這個領域的價格半年能改三次，文末附上全部資料來源。

如果你是要在三大工具之間做企業選型，建議先看我們的 Antigravity、Claude Code、Codex 三大 AI Coding Agent 完整比較；這一篇則是 Antigravity 的單獨深度回顧，由一個付費七個月的重度使用者，把踩過的坑跟真香的部分一次講完。

Antigravity 1.0 的七個月：從「最好用的 AI Agent」到全面逃離

先說好的部分。2025 年 11 月 18 日隨 Gemini 3 一起發表的 Antigravity，定位從第一天就跟別人不一樣：它不是「塞在編輯器裡的助手」，而是把 agent 拉到第一層介面的任務指揮中心：agent 能直接操作編輯器、終端機與瀏覽器，而且多個並行。對當時用慣補全式工具的我來說是降維打擊。這也是我願意直上頂級方案的原因：付最貴的錢，買的其實是 Claude 系列模型在多代理平台上的高額度，從上線初期的 Sonnet 4.5，一路用到後來 Ultra 訂戶限定的 Claude Opus 4.6 (Thinking)。

但從 2026 年第一季開始，這套組合逐漸崩壞。回頭看，問題出在三個地方：

Quota 與穩定性災難：3 月中的 1.20.5 版更新引入新的額度管理機制後，503／429 錯誤和「額度顯示與實際用量脫鉤」成了官方論壇最大宗的抱怨：不少 Pro 甚至 Ultra 訂戶碰上動輒數天的鎖定，社群回報的實際可用額度比先前縮水了九成以上。付著頂級月費還要排隊跟撞牆，體感非常糟。
Gemini 3.1 系列扛不起 agent 工作：單輪能力其實不差，但放進長任務就破功，卡在無限「thinking」、跑到一半斷線，或者最氣人的：agent 迴圈跑完、回報任務完成，實際上什麼都沒做（或做錯了）。這不是我一個人的體感，gemini-cli 的 GitHub issues 與各大論壇在 2～4 月累積了大量同類回報。所以那段時間，我在 Antigravity 裡幾乎只跑 Claude 模型。
Claude 版本嚴重跟不上：Anthropic 今年的出貨節奏快得嚇人，4 月 16 日 Opus 4.7、5 月 28 日 Opus 4.8、6 月 9 日直接端出超越 Opus 級的 Claude Fable 5（我們的大型專案實測開箱剛出爐）。但 Antigravity 的模型清單永遠慢半拍：Opus 4.7 發布超過 24 小時後，官方論壇出現一篇標題很殺的貼文，「Antigravity 是現在唯一還沒有它的主流 AI Coding 工具」。當你看著隔壁 Claude Code 第一天就能用新模型，遷移只是時間問題。

於是 4 月底，我把主力搬到了 Claude Code（那段時間的心得散落在 Vibe Coding 架構心法和台灣軟體業 AI 轉型實戰筆記兩篇裡），Antigravity 的訂閱一度只差一步就取消，直到 5 月 19 日的 Google I/O。

Antigravity 2.0 是什麼？30 秒總覽

2.0 最大的轉變：它不再是「一個 IDE」，而是一整個 agent 平台家族。官方文件把它拆成五個面向：

面向	是什麼	適合誰
Desktop App（新旗艦）	獨立桌面應用：多 agent 並行管理、排程任務、對話與成果（artifacts）集中檢視	所有人，包括非工程師
IDE	原本的 agent-first 編輯器，1.0 的延續	工程師日常開發
CLI	Go 寫的命令列工具，把 agent 帶進終端機與 CI	自動化、腳本派
SDK	用程式組裝自己的 agent 系統	開發 agent 產品的團隊
Managed Agents API	一個 API call 拿到「agent + 託管 Linux sandbox」：支援 Bash／Python／Node、檔案、瀏覽，技能用 Markdown 定義	想把 agent 嵌進自家系統的企業

發表會上最誇張的 demo，是用 93 個並行 sub-agent、一萬五千多次模型呼叫、26 億 tokens，在 12 小時內寫出一個作業系統，API 成本不到一千美元。先不論這種 demo 的實用性，它證明了 2.0 的多代理編排（orchestration）是玩真的，這正是 1.0 時代最常被詬病「並行一多就翻車」的地方。

另一個對我日常影響最大的是 Agent Skills：一個資料夾加一份 SKILL.md，就能教會 agent 一套新工作流。它是開放標準（與 Anthropic 的 skills 格式相容），社群的 skills 庫已經累積上千個現成技能，我的 Office 檔案處理流程就是這樣搭起來的，下面實測段細講。

Gemini 3.5 Flash：這次的主角是速度

Spec 與 Benchmark：用 Flash 的名字，打贏自家上一代 Pro

跟 2.0 一起發布的 Gemini 3.5 Flash，是 Google 這次「agent 優先」戰略的核心。官方公布的 agentic benchmark 數字全面壓過自家 Gemini 3.1 Pro：

項目	Gemini 3.5 Flash	備註
Terminal-Bench 2.1（終端機代理）	76.2%	官方數字，勝 Gemini 3.1 Pro
GDPval-AA（知識工作）	1656 Elo	官方數字
MCP Atlas（工具呼叫）	83.6%	官方數字
Context window	1M tokens（輸出上限 65k）	四檔 thinking level 可調
API 價格	$1.50 / 1M 輸入、$9.00 / 1M 輸出	美元計價
輸出速度	官方稱比同級 frontier 模型快 4 倍；第三方實測 280+ tokens/s	Antigravity 內限時以 12 倍速 serving

benchmark 數字因測試環境不同常有出入，這裡以官方發布值為準、來源附於文末，重點不是小數點，而是趨勢：一顆「Flash」定位的模型，在 agent 任務上打贏了上一代旗艦。對照 TechCrunch 的觀察，Google 這波押注非常明確：下一階段的競爭不在聊天機器人，在代理人。

Claude 跑 10 分鐘的任務，Flash 一分鐘交卷：4 倍速是什麼概念

數字講完，講體感。我最常跑的一類任務是「搜尋多個來源 → 交叉比對 → 彙整成結構化報告」，在 Claude Code 上用 Opus 跑，平均 10 分鐘上下；同樣的任務丟給 Antigravity 2.0 + Gemini 3.5 Flash，一分鐘出頭就跑完。官方說 4 倍、Antigravity 限時 12 倍速 serving，我的體感大概落在 8～10 倍，已經快到改變工作模式：以前送出任務會切去做別的事，現在我會「等它」，因為等的成本比切換上下文還低。

更重要的是長任務不再裝死。3.1 時代那種「跑完迴圈、宣稱完成、實際沒做」的災難，在我這三週多的使用裡幾乎沒再出現，該改的檔案真的改了、該跑的驗證真的跑了。這是質的飛躍，不是百分比的進步。

API 價格：快，但不便宜

潑一盆冷水：3.5 Flash 的 API 定價（$1.50／$9.00 per 1M tokens）比上一代 Flash 貴了一大截，第三方估算實際跑起來（含 thinking tokens）比 Gemini 3.1 Pro 還貴約 75%。訂閱制用戶無感，但如果你是要接 API 做產品，「Flash = 便宜」的舊印象要更新了，它現在是「速度檔」，不是「省錢檔」。

三週實測心得：哪些工作交給 Flash，哪些留給 Opus

從 I/O 至今三週多，我的工作流大致收斂成這樣的分工：

日常資料蒐集與比對 → Flash，真香。市場調查、競品價格比對、多來源交叉查證這類「廣而淺」的任務，Flash 一分鐘等級的回合時間讓你可以連發十次修正指令也不心疼。我們做 AEO／GEO 內容稽核時的資料蒐集，現在預設都丟給它。
Office 檔案批次處理 → Flash + Skills，意外的殺手級組合。透過 office 類 Agent Skills 加上 sandbox 裡的 Python，修改 Word 合約條款、重算 Excel 報價表、批次改 PowerPoint 模板，又快又穩。對非工程師同事來說，Desktop App + Skills 可能比 IDE 本體更有價值，這塊我們之後會寫一篇專文。
中小型程式修改、跑測試、改文案 → Flash 夠用。改個 API 欄位、補測試、調整頁面文案這種「看得到底」的任務，用 Opus 是殺雞用牛刀。
架構設計、大規模重構、品質敏感的程式碼 → 還是 Opus 4.8／Fable 5。品質的天花板目前仍在 Anthropic 手上：複雜依賴的重構、需要全案視野的架構決策，Flash 給出的方案明顯比較淺。速度可以買時間，買不到判斷力。
一個提醒：速度快，犯錯也快。agent 一分鐘能做完的事，也代表一分鐘能弄壞。權限護欄與審核流程要先架好，我們在那次 AI 代理人搞掛客戶資料庫之後學到的護欄心法和 AI 代理人監督模式兩篇有完整作法。

Google AI 訂閱方案總表（台灣價格，2026 年 6 月查證）

I/O 之後 Google 也把訂閱方案大改了一輪：頂級方案降價、新增一個中間檔，計費並逐步走向「算力消耗制」。台灣價格如下（查證於 2026 年 6 月 12 日，變動很快，下手前請以官方訂閱頁為準）：

方案	月費（台灣）	額度	Antigravity 相關權益
Google AI Plus	NT$165	免費版 2 倍	（（無 Antigravity 權益）
Google AI Pro	NT$650	免費版 4 倍	可用 Antigravity，輕度使用入門
Google AI Ultra（入門檔，新）	NT$3,300	Pro 的 5 倍	Gemini 3.5 Flash 優先存取、20TB 空間
Google AI Ultra（頂級檔）	NT$6,500（原 NT$8,150）	Pro 的 20 倍以上	最高 agent 模型額度，Claude Opus 4.6 (Thinking) 等頂級模型額度拉滿

身為從 NT$8,150 一路付過來的老訂戶，看到降價當然五味雜陳，但平心而論：新的 NT$3,300 檔是這次改版的甜蜜點）「想要 Flash 的速度 + Antigravity 2.0 的完整體驗，但不需要 20 倍額度」的人，入門檔就夠了。要注意的是 Claude Opus 級模型的高額度仍是頂級檔限定，而且 Antigravity 上的 Claude 版本目前停在 4.6，比 Anthropic 自家最新版落後兩個世代。

情境選型指南（Use Case × 模型 × 方案）

日常資料蒐集、文件處理、行政自動化 → Flash + Ultra 入門檔

NT$3,300 的入門 Ultra 配 Gemini 3.5 Flash，是目前「非開發類 agent 工作」CP 值最高的組合。如果你的需求更偏固定流程的串接（而不是開放式任務），先看看 n8n、Make、Zapier 的比較，工作流工具可能更便宜。

軟體團隊的主力開發 → Claude Code 為主、Antigravity 為輔

品質敏感的核心開發，模型品質就是一切，Opus 4.8／Fable 5 目前仍是天花板，而 Claude Code 永遠第一天拿到新模型。Antigravity 拿來跑資料任務與前端驗證，雙刀流不衝突。完整比較見我們的三大工具選型指南。

前端密集、需要瀏覽器自動驗證 → Antigravity 2.0

內建瀏覽器操作與截圖驗證仍是 Antigravity 的獨門優勢，配上 Flash 的速度，「改完 → 自己開瀏覽器檢查 → 修正」的迴圈快得驚人。

非工程師的知識工作者 → Desktop App + Skills

不用碰終端機，裝好 Desktop App、掛上 office 類 skills，就能把報表、合約、簡報的重複工作交給 agent。這是 2.0 真正打開的新客群。

預算有限的觀望者 → Pro 檔先試水溫

NT$650 就能體驗完整的 Antigravity 2.0 + Flash，輕度使用其實夠用；等撞到額度牆再升級也不遲。

結論：等 Gemini 3.5 Pro 端出什麼菜

I/O 現場最大的懸念，是 Sundar Pichai 那句「再給我們一個月」，Gemini 3.5 Pro 在 keynote 上只聞樓梯響，外媒推估 6 月下旬上線，已知的賣點是 2M token context 與 Deep Think 推理模式。

我的判斷很直接：如果 3.5 Pro 能把 Flash 這套「長任務不裝死 + 速度經濟學」帶到 Opus 級的品質，AI Coding Agent 的牌桌就要重洗一次，屆時「品質選 Anthropic、速度選 Google」的二分法會被打破。但 Anthropic 也沒閒著，Fable 5 才剛把品質天花板又抬高了一截（實測在這）。身為兩邊都付錢的用戶，這種軍備競賽我樂見其成：我的 Ultra 訂閱會留著等 3.5 Pro 開箱，到時候再寫一篇完整對決。

如果你的公司正在評估怎麼把這些 agent 工具落地成實際的流程自動化（從選型、權限護欄到跟既有系統串接），這正是我們每天在做的事，歡迎找我們聊聊你的場景。

資料來源與延伸連結

本文所有規格、價格與日期均於 2026 年 6 月 12 日逐一查證；價格與額度政策變動頻繁，請以官方頁面為準。

延伸閱讀：

本系列延伸閱讀

這篇是我們 Google Antigravity 系列的一部分，建議搭配延伸閱讀，完整掌握這套工具：

Google Antigravity 安裝與設定完整指南

// 推薦服務

首月免費 · 月費 NT$249 起

想用 n8n、Dify、WordPress，卻不想自己養伺服器？

RoamerHost 幫你把開源 AI 與自動化工具一鍵代管：獨立 Docker、自動 SSL、24/7 監控，60 秒上線。省下租機器、裝環境、顧維運的力氣，訂閱就能開始用。

▶立即免費註冊

// FAQ

常見問題

Antigravity 2.0 使用的底層 AI 模型是什麼？

主力模型是與 Antigravity 2.0 同天（2026 年 5 月 19 日 Google I/O）發表的 Gemini 3.5 Flash，官方稱比上一代快 4 倍，平台上另有限時的 12 倍速 serving。它不是唯一選項：Antigravity 也能切換 Claude Opus 4.6 (Thinking) 等模型，其高額度為頂級 Ultra 訂戶限定；Google 自家的 Gemini 3.5 Pro 已發表但延後上線。日常高頻任務用 Flash、品質敏感的工作切 Claude，是目前最務實的用法。

Antigravity 2.0 是免費的嗎？需要訂閱哪個方案？

平台本身在 preview 期間免費下載使用，但模型額度跟 Google AI 訂閱綁定：輕度使用 Google AI Pro（NT$650/月）即可入門；重度使用建議 AI Ultra，入門檔 NT$3,300/月（Pro 的 5 倍額度）或頂級檔 NT$6,500/月（Pro 的 20 倍以上）。Claude Opus 4.6 (Thinking) 的高額度為頂級 Ultra 訂戶限定。價格查證於 2026 年 6 月，請以官方頁面為準。

Gemini 3.5 Flash 跟 Claude Opus 4.8，該用哪一個？

看任務性質。Gemini 3.5 Flash 的優勢是速度（官方稱快 4 倍，Antigravity 內限時 12 倍速 serving），適合資料蒐集、文件批次處理、中小型修改這類高頻任務；Claude Opus 4.8／Fable 5 的品質上限更高，架構設計、大規模重構、品質敏感的程式碼仍建議用 Claude。實務上最好的解法是混搭分工。

Antigravity 2.0 可以處理 Word、Excel、PowerPoint 檔案嗎？

可以。透過 Agent Skills（開放的 SKILL.md 標準）搭配 Managed Agents 的 Linux sandbox（支援 Bash／Python／Node），agent 能直接讀寫與批次修改 Office 文件；社群 skills 庫已有上千個現成技能，包含 office-productivity 類別。搭配 Gemini 3.5 Flash 的速度，是非工程師也能上手的自動化方案。

Gemini 3.5 Pro 什麼時候推出？會有什麼功能？

Google 在 2026 年 5 月 19 日的 I/O 上宣布了 Gemini 3.5 Pro 但延後發布，執行長 Pichai 承諾「一個月內」推出，外媒推估 6 月下旬上線。已公開的重點規格包括 2M token context window 與 Deep Think 推理模式。

Antigravity 2.0 用的 Gemini 3.5 Flash，速度真的比舊版快 2 倍嗎？

比 2 倍更多。官方公布的數字是比上一代快 4 倍，Antigravity 平台上另有限時的 12 倍速 serving，我們連續實測數週的體感大約落在 8 到 10 倍：同樣的任務 Claude 要跑 10 分鐘，Flash 大約一分鐘交卷。網路上流傳「快 2 倍」的說法明顯低估了這次的升級幅度。不過速度快、犯錯也快，重要變更仍建議人工審查後再合併。

#Google Antigravity #Gemini 3.5 Flash #AI Coding Agent #Gemini 3.5 Pro #Claude Opus #AI 開發工具

// 本主題完整指南 · AI 自動化與智慧應用

→ 對話式 AI 已經不夠用了？Antigravity、Claude Code、Codex 三大 AI Coding Agent 完整比較與企業選型指南 → 2026 台灣企業 AI Agent 導入指南：從 PoC 幻覺到 ROI 落地的五大路徑

這個主題的完整脈絡、選型比較與導入建議，都整理在指南裡。

    
    ~/roamer-tech/newsletter
    // FREE
  
// newsletter
訂閱免費電子報
        把 AI 自動化、企業系統設計與 WordPress / Laravel 開發的真實案例和可直接照做的技巧，整理成電子報寄給你。只寄精選內容、不灌垃圾信，一鍵就能退訂。
      
        Website
      
        $
        subscribe