Google 重磅推出 ADK:開源框架如何化解多智能體 AI 的開發困境
1. 導言:應對 AI 開發的新挑戰
人工智慧 (AI) 領域正迎來下一個典範轉移:從專注於單一模型,迅速演進至能夠自主運作、協同合作的智能多智能體系統 (multi-agent systems)。然而,這場轉變也為開發者帶來了前所未有的挑戰。為此,在 Google Cloud NEXT 2025 大會上,Google 於 2025 年 4 月 9 日正式發布了一款名為 Agent Development Kit (ADK) 的全新開源框架。
ADK 並非又一個實驗性專案。根據 Google 官方揭露,它正是驅動 Google 內部產品如 Agentspace 和 Google Customer Engagement Suite (CES) 的核心框架,這意味著它是一個經過實戰驗證、足以應對生產級需求的解決方案。根據 Machine Learning Lead Erwin Huizenga 與 Software Engineer Bo Yang 的說法,ADK 的核心目標是簡化從單一智能體到多智能體系統的端到端開發流程,賦予開發者更高的靈活性與精確控制權。本文將深入探討當前開發者面臨的具體痛點,並解析 ADK 如何從根本上化解這些困境。
2. 開發現況的困境:為何多智能體系統建構如此困難?
在深入剖析 ADK 的解決方案之前,我們必須先理解當前開發者在建構 AI 智能體時所面臨的普遍挑戰,以及這些挑戰如何演變成企業導入 AI 的關鍵業務瓶頸。
綜合 LiveLab 講座的內容,當前開發環境最嚴峻的問題是「碎片化」。每個團隊幾乎都在「重複造輪子」,導致開發人員耗費數月時間在基礎架構設計上,而非專注於解決實際的業務場景。這不僅是開發者的不便,更是對工程資源的巨大浪費,直接拖延了 AI 功能的上市時程,並帶來建構出無法擴展、難以維護系統的巨大風險。
此外,讓多個智能體高效協同工作亦是一大難題。在一個由多個智能體組成的任務鏈中,單一智能體的故障就可能導致整個鏈條中斷,且由於系統的複雜性,要精準定位失敗點往往極為困難,增加了除錯與維護的複雜度。
當企業試圖將智能體應用擴展至生產環境時,更會面臨一系列嚴峻的生產級挑戰:
• 依賴性管理:如何清晰地管理不同智能體之間的任務委派與數據傳遞。
• 部署與擴展性:如何確保系統能夠無縫部署、穩定擴展並有效監控。
• 可靠性與治理:如何確保智能體在自主決策下的行為符合企業的治理與合規性 (governance and compliance) 要求。
正是為了解決這些深植於開發流程中的根本性問題,Google 才推出了 Agent Development Kit (ADK),旨在提供一個更統一、高效的解決方案。
3. ADK 核心架構解析:化繁為簡的四大支柱
ADK 的核心設計理念是提供一個統一的工具包,涵蓋從建構、互動、評估到部署的整個智能體開發生命週期。它的架構旨在從根本上解決前述的碎片化與複雜性挑戰,為開發者提供一個清晰且強大的基礎。
為多智能體而生 (Multi-Agent by Design)
ADK 的架構原生支援多智能體系統。它允許開發者透過分層結構 (hierarchy) 來組合多個專業化的智能體,如同建立一個各司其職的 AI 團隊。這種模組化的設計不僅提升了應用的可擴展性與可維護性,更促進了智能體之間複雜的協調與任務委派,讓開發者能輕鬆建構出能夠處理多步驟、複雜任務的智能系統。
開放的生態系統 (Rich Model and Tool Ecosystems)
ADK 在模型和工具的選擇上提供了極大的靈活性,避免了供應商鎖定的困境。
• 模型支援:除了深度整合 Google 自家的 Gemini 模型和 Vertex AI Model Garden,ADK 更透過 LiteLLM 整合了來自 Anthropic、Meta、Mistral AI 等多家頂尖供應商的模型,讓開發者能為特定任務選擇最適合的 LLM。
• 工具整合:ADK 賦予智能體連接外部世界的能力。它不僅提供如 Google Search、程式碼執行 (Code Exec) 等內建工具,還能無縫整合 LangChain、LlamaIndex 等第三方函式庫。更具突破性的是,它甚至能將使用 LangGraph、CrewAI 等其他框架建構的智能體作為工具來調用,展現了其高度的開放性與互操作性。
靈活的流程編排與互動 (Flexible Orchestration and Interaction)
ADK 提供了兩種定義工作流程的方式,兼顧了可預測性與自適應能力。
• 可預測流程:開發者可以使用工作流程智能體 (如 Sequential, Parallel, Loop) 建立確定性的執行管線,確保任務按照預定順序或模式進行。
• 動態路由:利用由大型語言模型驅動的動態路由 (LlmAgent transfer),智能體可以根據對話上下文自主決定下一步驟或將任務委派給最適合的子智能體,實現更具智慧的自適應行為。
值得一提的是,ADK 內建了獨特的雙向音訊與視訊串流功能 (bidirectional audio and video streaming)。這項功能讓智能體與使用者的互動超越了傳統的文字對話,進入更自然、更具沉浸感的多模態交流,為即時語音助理、視訊分析等應用場景開啟了新的可能性。
整合的開發、評估與部署體驗
ADK 致力於提供一個無縫的端到端開發體驗,降低了從原型到生產的門檻。
• 開發與偵錯:透過強大的命令列介面 (CLI) 和視覺化的 Web UI,開發者可以在本地環境中輕鬆進行開發、測試和逐步偵錯,深入檢視智能體的每一步執行軌跡與狀態變化。
• 內建評估框架:可靠性是生產級智能體的關鍵。ADK 內建了評估框架,讓開發者能系統性地評估智能體的最終回應品質與執行路徑的正確性,確保其行為符合預期。
• 清晰的部署路徑:當智能體準備就緒後,ADK 提供了明確的部署選項。開發者可將智能體容器化並部署到任何環境,或無縫整合至 Vertex AI Agent Engine,利用其全託管、企業級的運行環境來實現規模化部署。
總而言之,ADK 的核心架構透過這四大支柱,為開發者提供了一個全面、靈活且強大的基礎,使其能專注於智能體的邏輯與行為,而非基礎設施的搭建。接下來,我們將探討 ADK 在 Google 更宏大的戰略中所扮演的角色。
4. 不僅是工具包:完整的 Google Agentic Stack
ADK 並非一個孤立的工具,而是 Google 更宏大的「Agentic Stack」戰略中的核心組件。這個技術堆疊旨在為企業提供一個從開發、整合、部署到協作的端到端智能體解決方案,並直接回應了前述的各項開發挑戰。
以下是 Agentic Stack 的四個主要組成部分:
• Agent Development Kit (ADK): 作為整個堆疊的核心,ADK 是一個開源工具包,專為創建、測試和啟動 AI 智能體而設計,從源頭上解決了開發碎片化的問題。
• Model Context Protocol (MCP): MCP 是一個開放協議,旨在標準化應用程式與大型語言模型之間的上下文共享方式。舉例來說,當智能體需要從資料庫 (database) 或 Web 服務 (web service) 獲取數據時,MCP 定義了一套一致的收發資訊方式,從而簡化了與外部系統的整合,降低了數據交換的複雜性。
• Vertex AI Agent Engine: 這正是應對前述「部署、擴展性與可靠性」挑戰的直接答案。作為一個專為部署、管理和擴展 AI 智能體而設計的全託管平台,它負責處理基礎設施、安全性、擴展性和監控等生產環境中的複雜難題,讓開發團隊能專注於智能體本身的業務邏輯。
• Agent-to-Agent Protocol (A2A): A2A 是一個開放標準,旨在讓不同來源、不同架構的 AI 智能體之間能夠無縫地對話與協作。這為建立由多個專業智能體組成的複雜生態系統奠定了基礎,直接解決了智能體間的互操作性問題。
這四個組件的緊密結合,為開發者提供了一個從本地開發到全球化生產、完整且高度整合的企業級智能體建構平台,有效解決了從開發到部署的各種挑戰。
5. 戰略定位:ADK vs. Genkit 與 Google Cloud 優化
為了幫助開發者根據專案需求做出正確的技術選型,釐清 ADK 與 Google 另一流行框架 Genkit 的區別至關重要。Google 對這兩者的定位,揭示了其在開發者生態系中的清晰分層策略。
|
框架 |
核心焦點 |
|
Agent Development Kit (ADK) |
為複雜智能體和多智能體系統優化,提供更高層次的抽象,專注於定義智能體的行為與互動。 |
|
Genkit |
提供建構多樣化 AI 體驗的基礎模塊,具備廣泛的靈活性,適用於各種生成式 AI 專案。 |
總結來說,選擇建議非常明確:如果您的專案目標是建構需要複雜協作與流程編排的多智能體系統,ADK 憑藉其專為此類場景設計的架構,無疑是更強大的選擇。對於其他需要高度靈活性、快速迭代的生成式 AI 專案,Genkit 則提供了絕佳的基礎。
為 Google Cloud 環境優化
雖然 ADK 是一個開放且靈活的框架,但它在 Google Cloud 環境中能發揮出最強大的潛力。這主要得益於其與 Gemini 模型(特別是 Gemini 2.5 Pro Experimental) 和 Vertex AI 的深度原生整合。這種整合不僅讓開發者能充分利用 Gemini 模型先進的推理與工具使用能力,還提供了一條直達 Vertex AI 企業級託管平台的無縫部署路徑。
更重要的是,ADK 能夠深入企業的數據和應用生態系統。它透過超過 100 個預建連接器,讓智能體能直接存取 BigQuery、AlloyDB 等核心數據系統中的資料,無需進行數據複製。同時,它還能透過 Apigee 安全地利用企業現有的 API 資產,將既有服務轉化為智能體可用的工具。這種全面的連接性使 ADK 在 Google Cloud 中成為一個極具吸引力的選擇。
6. 結論:用 ADK 開創下一代智能體
Agent Development Kit (ADK) 的推出,標誌著 Google 為應對多智能體 AI 開發的複雜性邁出了關鍵一步。它作為一個強大、靈活且經過實戰驗證的開源基礎,成功解決了開發者在建構協作式智能系統時面臨的核心挑戰,從碎片化的工具鏈到生產部署的可靠性難題。
ADK 的核心價值主張可以精煉地歸納為以下幾點:
• 精確控制: 提供對智能體行為和工作流程的細粒度掌握。
• 豐富生態: 整合了廣泛的工具和模型,具備高度的開放性。
• 整合體驗: 提供從開發、測試到偵錯的無縫流程。
• 強大評估: 內建確保智能體可靠性與品質的關鍵框架。
• 清晰部署: 提供包含託管選項的明確生產路徑,簡化上線流程。
我們正處於一個由單一 AI 模型向智能體生態系統演進的轉捩點。ADK 為開發者社群提供了一套強而有力的工具,挑戰他們超越基礎建設的束縛,專注於創新。我們有理由相信,下一代顛覆性的 AI 應用,將從這裡開始。
--------------------------------------------------------------------------------
資料來源
• CTS | Gemini at Work Edition 2025 | Day 1: LiveLab 1: Get started with Agent Development Kit (ADK)
• CTS | Gemini at Work Edition 2025 | Day 1: LiveLab 2: Build multi-agent systems with ADK
• CTS | Gemini at Work Edition 2025 | Day 1: LiveLabs Introduction
• CTS | Gemini at Work Edition 2025 | Day 2: Featured Demo: Gemini CLI