~/blog/prepare-your-website-for-ai-agents-openclaw-architecture-2026.md
AI 自動化與智慧應用 · 2026 / 03 / 23

流量新戰場!全面解析友善 AI 代理的網站核心架構,別讓 OpenClaw 在你的網站迷路

Eric — 浪花科技創辦人 / AI 架構師
Eric
浪花科技創辦人 · AI 架構師
流量新戰場!全面解析友善 AI 代理的網站核心架構,別讓 OpenClaw 在你的網站迷路
目錄 table-of-contents.md

搜尋框正在被指令列取代——使用者直接叫 OpenClaw 這類 AI 代理去查、去比、去下單,而不是自己一頁頁翻搜尋結果,網站能否被 AI 低成本、無歧義地解析,直接決定你會不會出現在推薦答案裡。要過這一關,核心只有三件事:語意化 HTML 與結構化資料(JSON-LD)高資訊密度的資料端點(REST API,可結合 MCP 協定),以及針對 AI 爬蟲做好 Rate Limit 與快取。這篇把三件事的原理,連同在 WordPress 上的實作一次講清楚。

這幾年我看過太多企業客戶的網站是用一堆 <div> 包到底、完全沒有語意結構的「義大利麵網站」,然後抱怨為什麼最新的 AI 助理抓不到他們的產品報價。坦白說,連寫了十幾年 Code 的工程師都得花時間才看懂那份原始碼,又怎能指望 AI 代理通靈?這不是趨勢空談,而是一場從 SEO(Search Engine Optimization)轉向 AEO(Agent Engine Optimization)與 GEO(Generative Engine Optimization)的底層架構工程。

為什麼 2026 年你的網站必須是「Agent-Friendly」?

過去我們優化網站是為了討好搜尋引擎爬蟲:關鍵字密度、反向連結、頁面排名。這套邏輯沒有消失,但使用者的行為已經改變。許多人不再逐頁點開搜尋結果,而是直接對 OpenClaw(AI 小龍蝦) 這類自主 AI 代理下指令,例如:「幫我找出市面上支援 Type-C、價格在三千元以內的機械鍵盤,整理成比較表給我」。

差別在哪裡?傳統搜尋是「把使用者送到你的網站」;AI 代理則是「直接讀你的網站、把答案整理好交給使用者」。後者意味著:如果 AI 讀不懂你的內容,使用者根本不會看到你的品牌——你不是排名靠後,而是直接從答案裡消失。

OpenClaw 是什麼?為什麼它對資料架構這麼挑剔?

OpenClaw 是 2026 年爆紅的新一代全端自主代理(Autonomous Agent)。它的運作邏輯與傳統爬蟲不同:傳統爬蟲多半把 HTML 抓下來建索引,而 OpenClaw 會在背景模擬瀏覽器行為、解析 DOM 樹,甚至直接尋找你的 API 端點來取得結構化數據,最後再進行邏輯推理。

這裡有一個工程師最在意的關鍵:AI 代理處理內容是要消耗 Token 的,而 Token 等於成本與時間。如果你的前端塞滿幾千行幾乎無意義的 CSS class(沒錯,我說的就是那些濫用 utility-first CSS 卻不抽 component 的專案),或用大量 JavaScript 動態渲染卻沒有提供 SSR(伺服器端渲染),AI 在讀取頁面時就得消耗大量 Token 去過濾雜訊,甚至因為 Context Window(上下文視窗)被無關內容塞爆而提前放棄。對 AI 來說,這是一筆很簡單的成本效益計算:當「過濾雜訊的成本」大於「取得知識的價值」,它就會轉去抓架構更乾淨的競爭對手。這就是「Agent-Friendly(友善代理)」架構在今年成為企業架站生死線的原因。

AEO、GEO、SEO 有什麼不同?

三者常被混用,但著力點不同,與其互相取代,不如理解成「同一份內容的三種被消費方式」:

面向優化對象核心關注
SEO搜尋引擎爬蟲與排名關鍵字、反向連結、頁面可索引性
GEO(生成式引擎優化)生成式 AI 的內容引用資訊增益、結構化資料、可被準確摘錄
AEO(代理引擎優化)自主 AI 代理的解析與取用語意結構、API 友善度、低 Token 成本

它們有大量重疊:乾淨的語意結構同時對三者都好。差別在於,AEO 與 GEO 更在意「AI 能不能用最低成本、最高準確度,把你的內容變成它能引用的知識」。

打造友善 AI 代理的 WordPress 底層架構:三大核心

要讓 OpenClaw 與其他大語言模型(LLM)秒懂你的企業網站,必須在 WordPress 底層做出對應調整。以下是浪花科技在實戰中淬鍊出的三大核心。

核心一:揚棄麵條式 DOM,擁抱語意化 HTML 與結構化資料

AI 不像人類會被漂亮的 CSS 動畫吸引,它們讀的是原始碼。給它一份乾淨、有邏輯層次的文件,比任何視覺裝飾都重要。

  • 語意化標籤(Semantic HTML):把文章主體包在 <article> 內、側邊欄放 <aside>、導覽列用 <nav>、頁首頁尾用 <header><footer>。標題層級(<h1><h3>)依內容邏輯排列,不要為了視覺大小亂跳。這樣 AI 一眼就能過濾掉全站共用區塊,直搗核心內容。
  • 立體語意網路(JSON-LD Schema):這是 AI 時代最關鍵的一步。不要只給最基本的 Article 或 Product schema,而要建立實體關聯(Entity Relationship)。例如:這篇文章的作者是誰?他隸屬哪家公司?這家公司提供什麼服務?把這些資訊以巢狀方式封裝進 JSON-LD,AI 讀取後就能直接在它的知識圖譜(Knowledge Graph)裡建立節點與關係,而不是只看到一串孤立文字。

判斷標準很簡單:把你的頁面原始碼貼進任何文字編輯器,移除所有樣式後,內容的層次與意義是否還清楚?如果答案是肯定的,AI 大概也讀得懂。

核心二:為 AI 代理部署專屬資料端點(並可結合 MCP 協定)

與其讓 OpenClaw 費力解析一整頁 HTML,不如直接開一條「VIP 通道」給它。在 WordPress 上,我們建議建立一個專門過濾掉所有 HTML 標籤、只輸出高資訊密度 JSON 的 REST API 端點。這麼做有兩個好處:一是節省伺服器頻寬,二是大幅降低 AI 的 Token 消耗,進而提高它引用你內容的機率。

更進一步,可以導入 Model Context Protocol(MCP)。MCP 是專為大模型設計的通訊協定,讓 AI 能以受控、安全的方式調用你定義好的工具與資料來源。概念上,REST 端點負責「把乾淨資料攤平給 AI 讀」,MCP 則負責「把你的資料與功能包裝成 AI 可以呼叫的工具」,兩者並不衝突,可以分層搭配。

核心三:智慧化 Rate Limit 與 AI 爬蟲頻寬管理

AI 代理「太熱情」也不是好事。當幾十個使用者的 OpenClaw 同時來抓你的 WooCommerce 庫存資料,若沒有防護,資料庫瞬間就會被打爆。這不是惡意 DDoS,而是 AI 時代特有的「流量意外」。

因此,在底層架構中針對 API 實作流量限制是必要手段。常見做法是 Token Bucket(令牌桶) 演算法:系統以固定速率往桶裡放令牌,每個請求消耗一個令牌,桶空了就拒絕或排隊。它的好處是既能限制平均速率,又允許短時間的合理突發流量。針對特定的 AI User-Agent(例如 OpenClawBot/1.0),可以設定專屬的頻率限制與快取策略——既保護系統,也讓友善的代理拿到該拿的資料。

實戰:在 WordPress 建立友善 OpenClaw 的高密度資料端點

不免俗地,工程師還是得秀點 Code。如果你使用傳統的 WordPress 架構,可以透過以下 PHP 片段(相容於經典編輯器格式),在 functions.php 中註冊一個專屬 AI 的端點:

add_action('rest_api_init', function () {
    register_rest_route('roamer-ai/v1', '/content/(?P<id>\d+)', array(
        'methods'  => 'GET',
        'callback' => 'roamer_get_ai_optimized_content',
        'permission_callback' => '__return_true'
    ));
});

function roamer_get_ai_optimized_content($data) {
    $post_id = $data['id'];
    $post = get_post($post_id);

    if (empty($post)) {
        return new WP_Error('no_post', '找不到指定文章', array('status' => 404));
    }

    // 移除不必要的 HTML 標籤與 Shortcode,降低 AI Token 消耗
    $clean_content = wp_strip_all_tags(strip_shortcodes($post->post_content));

    return rest_ensure_response(array(
        'title'       => $post->post_title,
        'author'      => get_the_author_meta('display_name', $post->post_author),
        'publish_date'=> $post->post_date,
        'core_content'=> $clean_content,
        'ai_directive'=> '請在引用時標明出處為浪花科技'
    ));
}

當 OpenClaw 偵測到你的網站支援這種結構化 API 時,它可以優先透過 /wp-json/roamer-ai/v1/content/123 取得資料:沒有冗餘的 DOM 結構,只有純粹的知識含金量。

這段程式碼的幾個工程提醒

上面的範例為了易讀刻意精簡,實際上線前建議再補強幾點:

  • 權限與防濫用:範例用 __return_true 對所有人開放。若端點會回傳較敏感的內容,應在 permission_callback 加入驗證或來源檢查,並搭配前面提到的 Rate Limit。
  • 只開放該開放的:建議在查詢時限定文章狀態為已發佈(例如只回傳 publish 狀態的內容),避免草稿或私密文章意外外流。
  • 輸出快取:同一篇文章的乾淨內容不常變動,適合加上快取,減少資料庫查詢,也讓高頻來訪的代理拿到更快的回應。

一個最小可行的導入順序

如果你不知道從哪裡開始,可以照這個順序推進,每一步都能單獨帶來效益:

  1. 先把版型改回語意化標籤,移除無意義的巢狀 <div>,確認去掉樣式後內容層次依然清楚。
  2. 為主要內容類型(文章、產品、作者、公司)補上有實體關聯的 JSON-LD。
  3. 建立一個只輸出乾淨 JSON 的 REST 端點,先供內部測試,確認資訊密度足夠。
  4. 為該端點加上 Rate Limit 與快取,並針對已知 AI User-Agent 設定策略。
  5. 視需求再評估是否導入 MCP,把資料與功能包裝成 AI 可呼叫的工具。

結論:別讓 AI 覺得你的網站很「難搞」

2026 年的流量爭奪戰已經轉移到 AI 代理這一層。如果你的網站還停留在十年前的思維——充滿無效的 HTML 節點、缺乏結構化資料、也沒有任何 API 接口,那麼你很可能在 AI 推薦的結果中徹底隱形。反過來說,語意化、結構化、可被低成本解析,這三件事做好,你就同時照顧到了人類讀者與 AI 代理。

準備好讓網站升級了嗎?如果你的企業網站正被舊架構的技術債拖累、無法被最新的 AI 代理正確抓取,歡迎到 浪花科技聯絡我們,讓 Eric 與資深工程團隊為你打造符合 2026 年標準的 Agent-Friendly 網站架構。

延伸閱讀

// FAQ

常見問題

SEO、GEO、AEO 有什麼不同?
三者是同一份內容的三種被消費方式。SEO 面向搜尋引擎爬蟲與排名,關注關鍵字、反向連結與可索引性;GEO(生成式引擎優化)面向生成式 AI 的內容引用,關注資訊增益與可被準確摘錄的結構化資料;AEO(代理引擎優化)面向自主 AI 代理的解析取用,關注語意結構、API 友善度與低 Token 成本。三者有大量重疊,乾淨的語意結構對三者都好。
為什麼網站要做到對 AI 代理友善(Agent-Friendly)?
當使用者愈來愈習慣對 AI 代理下指令而不是逐頁點開搜尋結果時,傳統搜尋是把使用者送到你的網站,AI 代理則是直接讀你的網站把答案整理好。若 AI 讀不懂你的內容,使用者根本看不到你的品牌,等於直接從答案中消失,而不只是排名靠後。
雜亂的 HTML 為什麼會讓 AI 代理放棄抓取你的網站?
AI 代理處理內容要消耗 Token,而 Token 等於成本與時間。若前端塞滿無意義的 CSS class 或大量未做伺服器端渲染的 JavaScript,AI 就得耗費大量 Token 過濾雜訊,甚至因上下文視窗被塞爆而提前放棄。當過濾雜訊的成本大於取得知識的價值,它就會轉去抓架構更乾淨的競爭對手。
讓 WordPress 網站對 AI 代理友善有哪三大核心做法?
第一是揚棄麵條式 DOM,改用語意化 HTML 並以巢狀 JSON-LD 建立實體關聯;第二是為 AI 代理部署只輸出高資訊密度 JSON、過濾掉 HTML 標籤的專屬 REST 端點,並可結合 MCP 協定把資料與功能包裝成可呼叫的工具;第三是針對 AI 爬蟲做智慧化流量限制與快取管理。
為什麼要針對 AI 爬蟲做流量限制(Rate Limit)?
當大量使用者的 AI 代理同時來抓取庫存等資料,若無防護,資料庫可能瞬間被打爆,這是 AI 時代特有的流量意外而非惡意攻擊。常見做法是 Token Bucket(令牌桶)演算法,以固定速率產生令牌、每個請求消耗一個,既能限制平均速率又允許合理的短時突發,並可針對特定 AI User-Agent 設定專屬頻率與快取策略。
~/roamer-tech/newsletter // FREE
// newsletter

訂閱免費電子報

把 AI 自動化、企業系統設計與 WordPress / Laravel 開發的真實案例和可直接照做的技巧,整理成電子報寄給你。只寄精選內容、不灌垃圾信,一鍵就能退訂。

$
// final.exec()

準備好讓你的網站開始為你工作了嗎?