對話式 AI 已經不夠用了?Antigravity、Claude Code、Codex 三大 AI Coding Agent 完整比較與企業選型指南
☰ 目錄 table-of-contents.md
「我們公司也有買 ChatGPT 啊,怎麼工程師還是說 AI 幫不上忙?」這是我們近半年在客戶會議裡最常聽到的一句話。老闆買了帳號、同仁也真的在用,但需求單的消化速度沒變快、上線時程照樣延期。問題不在 AI 不夠聰明,而在於「會聊天」和「會做事」是兩回事:對話式 AI 給你的是建議,你的團隊缺的卻是能直接動手的人力。
2026 年,這個缺口被一整個新世代的工具補上了:AI Coding Agent(AI 編程代理人)。它們不再只是回答問題,而是能讀懂整個專案、規劃步驟、修改檔案、跑測試、甚至自己開 Pull Request。目前檯面上聲量最大的三套,分別是 Google 的 Antigravity、Anthropic 的 Claude Code,以及 OpenAI 的 Codex。
這篇文章是我們替企業客戶做技術選型時的內部評估筆記公開版。所有功能與價格資訊,都在 2026 年 6 月 11 日重新逐一查證過官方頁面與多方來源(這個領域的價格半年能改三次,文末會附上所有資料來源)。如果你正在評估公司該導入哪一套,建議把這篇從頭看完。
為什麼「會聊天的 AI」撐不起企業的開發現場?
先把問題說清楚。把 ChatGPT、Gemini 網頁版這類對話式 AI 用在軟體開發上,會卡在四個結構性的天花板:
- 複製貼上的工作流斷裂:你得把程式碼貼給它、把答案貼回編輯器、自己跑測試、自己處理報錯,再貼回去問。AI 思考三秒,你搬運三分鐘 —— 真正的瓶頸從來不是模型,是中間那個「人肉膠水」。
- 看不到完整的專案脈絡:對話視窗裝不下一個十萬行的 Laravel 專案。AI 沒看過你的資料表結構、命名慣例與歷史包袱,給出的程式碼自然「單檔正確、全案錯誤」。
- 無法執行與驗證:對話式 AI 寫完就交卷,不會自己跑測試、不會開瀏覽器看畫面有沒有跑版。驗證成本全部回到工程師身上。
- 缺乏權限與稽核機制:同仁把公司程式碼貼進個人帳號的聊天視窗,資料去了哪裡、誰貼過什麼,IT 部門完全無從管理。這在金融、醫療等產業是直接踩紅線。
AI Coding Agent 的出現,就是衝著這四個天花板來的。它們直接接管「讀程式碼 → 規劃 → 動手改 → 驗證 → 交付」的完整迴圈,人類的角色從「搬運工」變成「審核者」。這也是為什麼我們在2026 台灣企業 AI Agent 導入指南裡反覆強調:導入 AI 的關鍵指標不是「有沒有買帳號」,而是「AI 能不能直接在你的工作流裡完成閉環」。
三大主角是誰?先看 30 秒總覽
其實早在 2025 年我們就比較過 Copilot、Cursor 與初代 Antigravity,但一年過去,戰場已經完全洗牌:三大模型廠親自下場,把「補全程式碼的助手」升級成「能獨立做事的代理人平台」。
| 項目 | Google Antigravity | Claude Code | OpenAI Codex |
|---|---|---|---|
| 開發商 | Anthropic | OpenAI | |
| 產品定位 | Agent-first 桌面開發平台 | 終端機優先的編程代理人 | 綁定 ChatGPT 的雲端編程代理 |
| 主要介面 | 獨立桌面 App + CLI + SDK | 終端機 CLI + IDE 擴充 + Web / Desktop | 雲端沙盒 + 開源 CLI + IDE 擴充 + Desktop App |
| 預設模型 | Gemini 3.5 Flash | Claude Opus 4.8 | GPT-5.5 |
| 多模型支援 | ✅ 可切換 Claude、GPT-OSS | ❌ 僅 Anthropic 模型 | ❌ 僅 OpenAI 模型 |
| 入門價格 | 免費版 / Pro 月付 $19.99 起 | 免費版 / Pro 月付 $20 起 | 免費版 / Go 月付 $8 起 |
備註:本文價格均為美元月費,查證日期為 2026 年 6 月 11 日。
Google Antigravity:多模型並行的「Agent 指揮中心」
Antigravity 在 2025 年 11 月隨 Gemini 3 問世,當時還帶著濃濃的 IDE 血統;2026 年 5 月 Google I/O 上發表的 Antigravity 2.0 則徹底轉骨——它不再是「一個會寫程式的編輯器」,而是一個從零打造的 agent 指揮中心(我們在 Agentic IDE 時代的解析裡預測過這個方向,沒想到 Google 走得更激進)。
核心功能
- 多代理人並行調度:透過 Agent Manager 同時派遣多個 agent 處理不同任務,搭配動態子代理人(subagents)分工。實際的工作流設計可以參考我們的 Antigravity 多代理人開發實戰。
- 內建 Chromium 瀏覽器:agent 改完前端後可以自己開瀏覽器渲染、截圖、驗證 UI,這是三套工具中唯一的原生能力。
- 跨 repo 專案工作區與排程任務:一個 workspace 可橫跨多個儲存庫,並支援排程背景任務(例如每天自動巡檢依賴更新)。
- 多模型自由切換:預設 Gemini 3.5 Flash,也能換 Gemini 3.1 Pro、Claude Sonnet 4.6 / Opus 4.6,甚至開源的 GPT-OSS 120B——讓不同 agent 用不同模型跑同一個專案。
- 生態系完整補課:2026 年 3 月補上 MCP 支援,全新 Go 語言打造的 Antigravity CLI 預計 6 月 18 日正式取代 Gemini CLI,並開放 SDK 供企業自建 agent。
價格方案
- 免費版:可用但額度緊,且歷經多次調降(2025 年 12 月免費請求數一口氣砍了約九成)。
- Google AI Pro:月付 $19.99,內含基本 Antigravity 額度。
- Google AI Ultra:I/O 2026 後改為兩級——$99.99(Pro 的 5 倍額度)與 $200(20 倍額度,由原本的 $249.99 下修)。
- AI Credits 加購:$25 購買 2,500 點(2026 年 3 月上路),但官方未公開點數與 token 的換算率,成本較難精算。
優勢與隱憂
Antigravity 最大的賣點是快:Gemini 3.5 Flash 在 Artificial Analysis 實測約 289 tokens/秒 的輸出速度,約是 Claude Opus 或 GPT-5.5 的四倍。加上原生瀏覽器驗證與多模型彈性,做全端 Web 專案的體驗非常流暢。
隱憂則有兩個。第一是定價政策反覆:半年內歷經免費額度大砍、改制 credits、Ultra 方案重組,對需要預算可預測性的企業是實際的風險。第二是 agent 權限偏激進:社群多次回報它執行指令過於大膽,企業導入前建議先讀我們的 Antigravity Secure Mode 沙盒實戰,把護欄先架好。企業治理面(SOC 2、SCIM 等)官方還在補強中。
Claude Code:把「程式碼品質」當成唯一信仰
Claude Code 是三者中最早走紅的,2025 年靠著終端機介面 + 高品質輸出在資深工程師圈封神,我們自己的主力工作流也建立在它之上——大型專案重構的實戰記錄和上線 30 天的血淚報告都寫過。2026 年的它已經不只活在終端機裡:Web、桌面版(Cowork)、VS Code / JetBrains 擴充一應俱全。
核心功能
- 終端機原生工作流:直接在專案目錄裡讀寫檔案、跑 git、執行測試,完整支援腳本化與 CI 自動化,是三者中可程式化程度最高的。
- 1M token 上下文:整個中大型專案塞得進去,跨檔案重構不必分段餵食。
- Dynamic Workflows(研究預覽):把任務自動拆給多個並行 subagent,補上過去單線程的短板。
- 雲端深度審查:
ultrareview指令把整條分支丟上雲端做多代理人交叉程式碼審查。 - Hooks / MCP / Skills 生態:可以掛自訂腳本、外部工具與領域知識包,客製彈性大。
模型與價格
預設模型是 2026 年 5 月底發布的 Claude Opus 4.8(SWE-Bench Verified 88.6%、SWE-Bench Pro 69.2%),更高階的 Claude Fable 5 在 6 月 9 日發表、6 月 22 日前開放免費試用——我們的兩天實測心得結論是:日常開發 Opus 4.8 已非常夠用,Fable 5 留給最硬的長週期任務。
- 免費版:現在連免費方案都內含 Claude Code(額度有限,試水溫夠用)。
- Pro:月付 $20(年繳折合 $17),個人開發者主力方案。
- Max:$100(5 倍用量)/ $200(20 倍用量),重度使用者與接案者首選。
- Team:標準席次月付 $25(年繳 $20)、Premium 席次 $125(年繳 $100,含 5 倍用量)。
- Enterprise:SSO、SCIM、稽核日誌、Compliance API、HIPAA-ready 等企業治理完整。
- API 計價:Opus 4.8 每百萬 tokens 輸入 $5 / 輸出 $25;Sonnet 4.6 為 $3 / $15。
優勢與隱憂
Claude Code 的護城河就是複雜任務的輸出品質:多步驟重構、架構級決策、需要深度推理的疑難雜症,目前社群共識仍是它最穩(The New Stack 半年實測的結論直白:「要品質,選 Claude Code」)。企業治理成熟度也是三者中最完整的。
代價有三:只能用 Anthropic 自家模型、終端機優先的學習曲線對非工程背景同仁不友善、團隊席次成本偏高。如果你的團隊還在用「憑感覺寫扣」的方式駕馭它,建議先讀為什麼你的 Vibe Coding 總是產出無法維護的架構,先把規格紀律建立起來。
OpenAI Codex:用 ChatGPT 訂閱「順便」擁有的雲端代工廠
Codex 的策略跟前兩者完全不同:它不單獨賣,而是直接綁進 ChatGPT 訂閱。你公司如果已經在付 ChatGPT 的錢,Codex 其實已經在你的工具箱裡了——這個「順便就有」的滲透策略,讓它成為三者中導入阻力最小的選項。
核心功能
- 雲端沙盒執行:任務直接在 OpenAI 的雲端容器裡跑,零本地環境設定。指派任務後可以關電腦,回來收 PR。
- 桌面 App 多代理工作流:macOS / Windows 桌面版用 git worktrees 讓多個 agent 平行處理不同分支、不同專案。
- 開源 Codex CLI:用 ChatGPT 帳號登入即可使用,連免費方案都包含。
- 辦公室整合最深:GitHub、Slack、Linear 原生整合,2026 年 6 月 2 日更一口氣推出六款商務情境 agent 外掛;另有 iOS App 與 screenshot-to-code。
- 模型陣容:GPT-5.5(2026 年 4 月 23 日發布)、GPT-5.4、GPT-5.3-Codex,Pro 用戶另可搶先試用 GPT-5.3-Codex-Spark 研究預覽版。
價格方案
- Free:$0,可小量體驗。
- Go:月付 $8——三大平台最低的付費門檻。
- Plus:月付 $20,含 Web / CLI / IDE / iOS 完整入口,每 5 小時約可發送 15–80 則 GPT-5.5 任務。
- Pro:$100 起,可選 5 倍(80–400 則)或 20 倍($200,300–1,600 則)額度,含 Spark 預覽。
- Business / Enterprise:用量計費,加大雲端 VM、SAML SSO、SCIM、Compliance API 稽核、資料駐留選項。
- API 計價:依模型而異,GPT-5.5 約每百萬 tokens 輸入 $5 / 輸出 $30。
優勢與隱憂
Codex 的強項是程式庫理解與雲端併發:Terminal-Bench 2.0 拿下 82.7%、SWE-Bench Verified 88.7%,搭配雲端沙盒「丟了就跑」的體驗,非常適合大量背景任務(批次修 lint、寫測試、依賴升級)。對已經全面採用 ChatGPT 的企業來說,它幾乎是零成本起步。
隱憂在於 cloud-first 的取捨:本地檔案整合不如 Claude Code 直接,GPT-5.5 的深思熟慮也帶來 10–30 秒的回應延遲,快速來回的小修改反而嫌慢。另外 2026 年 4 月改為 token 計費後,重度使用者的帳單明顯變貴,預算要重抓。
功能對照總表
| 功能 | Antigravity 2.0 | Claude Code | Codex |
|---|---|---|---|
| 並行多代理人 | ✅ Agent Manager 原生調度 | ✅ Dynamic Workflows(預覽) | ✅ 桌面版 git worktrees |
| 瀏覽器 UI 驗證 | ✅ 內建 Chromium | ⚠️ 需自行掛 MCP 工具 | ⚠️ 雲端 Sites 預覽 |
| 雲端背景執行 | ✅ 排程背景任務 | ✅ 雲端審查 / Cowork | ✅ 核心賣點,沙盒原生 |
| CLI 自動化 | ✅ 新 CLI(6/18 上線) | ✅ 最成熟,可完整腳本化 | ✅ 開源 CLI |
| MCP 生態 | ✅(2026/3 加入) | ✅ 生態最豐富 | ✅ |
| 上下文窗口 | 1M tokens | 1M tokens | 依模型,較小 |
| 輸出速度 | 🏆 約 289 tok/s | 中等 | 偏慢(深度推理取向) |
| 複雜任務品質 | 中上 | 🏆 社群共識最佳 | 強(程式庫理解見長) |
| 企業治理 | ⚠️ 補強中 | 🏆 SSO/SCIM/稽核完整 | ✅ Business 級以上完整 |
價格對照總表
| 級距 | Antigravity | Claude Code | Codex |
|---|---|---|---|
| 免費版 | 有(額度緊縮中) | 有(輕量額度) | 有 |
| 最低付費 | $19.99(AI Pro) | $20(Pro,年繳 $17) | 🏆 $8(Go) |
| 重度個人 | $99.99 / $200(Ultra) | $100 / $200(Max) | $100 / $200(Pro) |
| 團隊方案 | —(以個人帳號為主) | $25/席(Premium $125/席) | Business 用量計費 |
| 加購機制 | $25 = 2,500 點(換算率未公開) | API 計費透明($5/$25 per M) | Credits 制,費率表公開 |
| 價格穩定度 | ⚠️ 半年改三次 | 穩定 | 中(4 月改 token 計費) |
情境選型指南:你的公司適合哪一套?
規格表看完,回到真正的問題:「我的情境該選哪個?」以下是我們替客戶選型時實際使用的判斷樹:
新創 MVP、快速原型、預算有限 → Codex
$8 的 Go 方案就能用 CLI,雲端沙盒不用配環境,丟任務出去睡覺起來收成果。團隊如果已經在付 ChatGPT,導入成本趨近於零。
大型遺留系統重構、品質敏感產業 → Claude Code
金融、醫療、ERP 這類「錯一行賠百萬」的場景,輸出品質與企業治理是唯二重點,這兩項目前都是 Claude Code 領先。1M 上下文吃得下整個老專案,重構不必切香腸。
前端密集、需要自動化 UI 驗證 → Antigravity
內建 Chromium 讓 agent 改完自己開瀏覽器檢查跑版,這個閉環目前沒有對手。電商官網、行銷活動頁這類「視覺正確性=商業正確性」的專案特別適合。
深度綁定特定雲生態 → 跟著生態走
GCP / Firebase / Android 全家桶選 Antigravity;Microsoft / GitHub 生態其實還有第四個選項,可以參考我們的 Copilot Agent Mode 實測;OpenAI 企業版用戶自然是 Codex。
中大型企業的務實解:混搭
2026 年我們觀察到的成熟團隊幾乎都是混用:Claude Code 當主力開發、Codex 跑雲端背景雜務、Antigravity 負責前端驗證。三者入門方案加起來不到 $50/月,先讓團隊都摸過一輪,再依數據決定把預算押在哪一套的高階方案。
導入前,先把這三件事想清楚
工具選對只是及格,根據我們輔導企業導入的經驗,真正決定成敗的是配套:
- 權限護欄先於生產力:agent 拿到的權限等於一個不會喊累的工程師帳號。先讀那次 AI 代理人搞掛客戶資料庫之後學到的護欄心法,把白名單、沙盒、審批流程架好再上線。
- 審查流程要跟著改:AI 產出的程式碼量是人工的數倍,舊的 code review 流程會直接被淹沒。參考AI 產出審查流程改造重新設計把關機制。
- 從小專案開始量化:選一個邊界清楚的內部專案跑四週 PoC,記錄需求消化速度、缺陷率、token 成本三個數字,再決定全面推廣的節奏。
資料來源與延伸連結
本文所有規格與價格均查證於 2026 年 6 月 11 日,建議以官方頁面的最新版本為準:
- Google Antigravity 官方網站
- Claude 官方定價頁(含 Claude Code 各方案)
- Claude 官方說明:Pro / Max 方案使用 Claude Code
- OpenAI Codex 官方定價文件
- ChatGPT Codex 定價頁
- The New Stack:四大編程代理半年實測
- DataCamp:Claude Code vs Antigravity 深度比較
- XDA:三大工具一個月實測心得
- Antigravity 定價變動史整理
- Anthropic 官方:Claude Fable 5 發表公告
選型沒有標準答案,只有適不適合你的團隊體質。如果你想知道公司現有的開發流程適合導入哪一套、怎麼設計權限與審查配套,歡迎聯絡浪花科技——我們自己每天都在用這三套工具出貨,可以用第一線經驗幫你省下試錯成本。
常見問題
Q1: 預算有限的小團隊,該從哪一套開始?
Q2: 三套工具可以混用嗎?會不會很難管理?
Q3: 對資安與稽核要求高的企業,哪一套最成熟?
Q4: 這篇的價格資訊會不會很快過時?
訂閱免費電子報
把 AI 自動化、企業系統設計與 WordPress / Laravel 開發的真實案例和可直接照做的技巧,整理成電子報寄給你。只寄精選內容、不灌垃圾信,一鍵就能退訂。