Google 重磅推出 ADK:開源框架如何化解多智能體 AI 的開發困境

Google 重磅推出 ADK:開源框架如何化解多智能體 AI 的開發困境

1. 導言:應對 AI 開發的新挑戰

人工智慧 (AI) 領域正迎來下一個典範轉移:從專注於單一模型,迅速演進至能夠自主運作、協同合作的智能多智能體系統 (multi-agent systems)。然而,這場轉變也為開發者帶來了前所未有的挑戰。為此,在 Google Cloud NEXT 2025 大會上,Google 於 2025 年 4 月 9 日正式發布了一款名為 Agent Development Kit (ADK) 的全新開源框架。

ADK 並非又一個實驗性專案。根據 Google 官方揭露,它正是驅動 Google 內部產品如 Agentspace 和 Google Customer Engagement Suite (CES) 的核心框架,這意味著它是一個經過實戰驗證、足以應對生產級需求的解決方案。根據 Machine Learning Lead Erwin Huizenga 與 Software Engineer Bo Yang 的說法,ADK 的核心目標是簡化從單一智能體到多智能體系統的端到端開發流程,賦予開發者更高的靈活性與精確控制權。本文將深入探討當前開發者面臨的具體痛點,並解析 ADK 如何從根本上化解這些困境。

2. 開發現況的困境:為何多智能體系統建構如此困難?

在深入剖析 ADK 的解決方案之前,我們必須先理解當前開發者在建構 AI 智能體時所面臨的普遍挑戰,以及這些挑戰如何演變成企業導入 AI 的關鍵業務瓶頸。

綜合 LiveLab 講座的內容,當前開發環境最嚴峻的問題是「碎片化」。每個團隊幾乎都在「重複造輪子」,導致開發人員耗費數月時間在基礎架構設計上,而非專注於解決實際的業務場景。這不僅是開發者的不便,更是對工程資源的巨大浪費,直接拖延了 AI 功能的上市時程,並帶來建構出無法擴展、難以維護系統的巨大風險。

此外,讓多個智能體高效協同工作亦是一大難題。在一個由多個智能體組成的任務鏈中,單一智能體的故障就可能導致整個鏈條中斷,且由於系統的複雜性,要精準定位失敗點往往極為困難,增加了除錯與維護的複雜度。

當企業試圖將智能體應用擴展至生產環境時,更會面臨一系列嚴峻的生產級挑戰:

• 依賴性管理:如何清晰地管理不同智能體之間的任務委派與數據傳遞。

• 部署與擴展性:如何確保系統能夠無縫部署、穩定擴展並有效監控。

• 可靠性與治理:如何確保智能體在自主決策下的行為符合企業的治理與合規性 (governance and compliance) 要求。

正是為了解決這些深植於開發流程中的根本性問題,Google 才推出了 Agent Development Kit (ADK),旨在提供一個更統一、高效的解決方案。

3. ADK 核心架構解析:化繁為簡的四大支柱

ADK 的核心設計理念是提供一個統一的工具包,涵蓋從建構、互動、評估到部署的整個智能體開發生命週期。它的架構旨在從根本上解決前述的碎片化與複雜性挑戰,為開發者提供一個清晰且強大的基礎。

為多智能體而生 (Multi-Agent by Design)

ADK 的架構原生支援多智能體系統。它允許開發者透過分層結構 (hierarchy) 來組合多個專業化的智能體,如同建立一個各司其職的 AI 團隊。這種模組化的設計不僅提升了應用的可擴展性與可維護性,更促進了智能體之間複雜的協調與任務委派,讓開發者能輕鬆建構出能夠處理多步驟、複雜任務的智能系統。

開放的生態系統 (Rich Model and Tool Ecosystems)

ADK 在模型和工具的選擇上提供了極大的靈活性,避免了供應商鎖定的困境。

• 模型支援:除了深度整合 Google 自家的 Gemini 模型和 Vertex AI Model Garden,ADK 更透過 LiteLLM 整合了來自 Anthropic、Meta、Mistral AI 等多家頂尖供應商的模型,讓開發者能為特定任務選擇最適合的 LLM。

• 工具整合:ADK 賦予智能體連接外部世界的能力。它不僅提供如 Google Search、程式碼執行 (Code Exec) 等內建工具,還能無縫整合 LangChain、LlamaIndex 等第三方函式庫。更具突破性的是,它甚至能將使用 LangGraph、CrewAI 等其他框架建構的智能體作為工具來調用,展現了其高度的開放性與互操作性。

靈活的流程編排與互動 (Flexible Orchestration and Interaction)

ADK 提供了兩種定義工作流程的方式,兼顧了可預測性與自適應能力。

• 可預測流程:開發者可以使用工作流程智能體 (如 Sequential, Parallel, Loop) 建立確定性的執行管線,確保任務按照預定順序或模式進行。

• 動態路由:利用由大型語言模型驅動的動態路由 (LlmAgent transfer),智能體可以根據對話上下文自主決定下一步驟或將任務委派給最適合的子智能體,實現更具智慧的自適應行為。

值得一提的是,ADK 內建了獨特的雙向音訊與視訊串流功能 (bidirectional audio and video streaming)。這項功能讓智能體與使用者的互動超越了傳統的文字對話,進入更自然、更具沉浸感的多模態交流,為即時語音助理、視訊分析等應用場景開啟了新的可能性。

整合的開發、評估與部署體驗

ADK 致力於提供一個無縫的端到端開發體驗,降低了從原型到生產的門檻。

• 開發與偵錯:透過強大的命令列介面 (CLI) 和視覺化的 Web UI,開發者可以在本地環境中輕鬆進行開發、測試和逐步偵錯,深入檢視智能體的每一步執行軌跡與狀態變化。

• 內建評估框架:可靠性是生產級智能體的關鍵。ADK 內建了評估框架,讓開發者能系統性地評估智能體的最終回應品質與執行路徑的正確性,確保其行為符合預期。

• 清晰的部署路徑:當智能體準備就緒後,ADK 提供了明確的部署選項。開發者可將智能體容器化並部署到任何環境,或無縫整合至 Vertex AI Agent Engine,利用其全託管、企業級的運行環境來實現規模化部署。

總而言之,ADK 的核心架構透過這四大支柱,為開發者提供了一個全面、靈活且強大的基礎,使其能專注於智能體的邏輯與行為,而非基礎設施的搭建。接下來,我們將探討 ADK 在 Google 更宏大的戰略中所扮演的角色。

4. 不僅是工具包:完整的 Google Agentic Stack

ADK 並非一個孤立的工具,而是 Google 更宏大的「Agentic Stack」戰略中的核心組件。這個技術堆疊旨在為企業提供一個從開發、整合、部署到協作的端到端智能體解決方案,並直接回應了前述的各項開發挑戰。

以下是 Agentic Stack 的四個主要組成部分:

• Agent Development Kit (ADK): 作為整個堆疊的核心,ADK 是一個開源工具包,專為創建、測試和啟動 AI 智能體而設計,從源頭上解決了開發碎片化的問題。

• Model Context Protocol (MCP): MCP 是一個開放協議,旨在標準化應用程式與大型語言模型之間的上下文共享方式。舉例來說,當智能體需要從資料庫 (database) 或 Web 服務 (web service) 獲取數據時,MCP 定義了一套一致的收發資訊方式,從而簡化了與外部系統的整合,降低了數據交換的複雜性。

• Vertex AI Agent Engine: 這正是應對前述「部署、擴展性與可靠性」挑戰的直接答案。作為一個專為部署、管理和擴展 AI 智能體而設計的全託管平台,它負責處理基礎設施、安全性、擴展性和監控等生產環境中的複雜難題,讓開發團隊能專注於智能體本身的業務邏輯。

• Agent-to-Agent Protocol (A2A): A2A 是一個開放標準,旨在讓不同來源、不同架構的 AI 智能體之間能夠無縫地對話與協作。這為建立由多個專業智能體組成的複雜生態系統奠定了基礎,直接解決了智能體間的互操作性問題。

這四個組件的緊密結合,為開發者提供了一個從本地開發到全球化生產、完整且高度整合的企業級智能體建構平台,有效解決了從開發到部署的各種挑戰。

5. 戰略定位:ADK vs. Genkit 與 Google Cloud 優化

為了幫助開發者根據專案需求做出正確的技術選型,釐清 ADK 與 Google 另一流行框架 Genkit 的區別至關重要。Google 對這兩者的定位,揭示了其在開發者生態系中的清晰分層策略。

框架

核心焦點

Agent Development Kit (ADK)

為複雜智能體和多智能體系統優化,提供更高層次的抽象,專注於定義智能體的行為與互動。

Genkit

提供建構多樣化 AI 體驗的基礎模塊,具備廣泛的靈活性,適用於各種生成式 AI 專案。

總結來說,選擇建議非常明確:如果您的專案目標是建構需要複雜協作與流程編排的多智能體系統,ADK 憑藉其專為此類場景設計的架構,無疑是更強大的選擇。對於其他需要高度靈活性、快速迭代的生成式 AI 專案,Genkit 則提供了絕佳的基礎。

為 Google Cloud 環境優化

雖然 ADK 是一個開放且靈活的框架,但它在 Google Cloud 環境中能發揮出最強大的潛力。這主要得益於其與 Gemini 模型(特別是 Gemini 2.5 Pro Experimental) 和 Vertex AI 的深度原生整合。這種整合不僅讓開發者能充分利用 Gemini 模型先進的推理與工具使用能力,還提供了一條直達 Vertex AI 企業級託管平台的無縫部署路徑。

更重要的是,ADK 能夠深入企業的數據和應用生態系統。它透過超過 100 個預建連接器,讓智能體能直接存取 BigQueryAlloyDB 等核心數據系統中的資料,無需進行數據複製。同時,它還能透過 Apigee 安全地利用企業現有的 API 資產,將既有服務轉化為智能體可用的工具。這種全面的連接性使 ADK 在 Google Cloud 中成為一個極具吸引力的選擇。

6. 結論:用 ADK 開創下一代智能體

Agent Development Kit (ADK) 的推出,標誌著 Google 為應對多智能體 AI 開發的複雜性邁出了關鍵一步。它作為一個強大、靈活且經過實戰驗證的開源基礎,成功解決了開發者在建構協作式智能系統時面臨的核心挑戰,從碎片化的工具鏈到生產部署的可靠性難題。

ADK 的核心價值主張可以精煉地歸納為以下幾點:

• 精確控制: 提供對智能體行為和工作流程的細粒度掌握。

• 豐富生態: 整合了廣泛的工具和模型,具備高度的開放性。

• 整合體驗: 提供從開發、測試到偵錯的無縫流程。

• 強大評估: 內建確保智能體可靠性與品質的關鍵框架。

• 清晰部署: 提供包含託管選項的明確生產路徑,簡化上線流程。

我們正處於一個由單一 AI 模型向智能體生態系統演進的轉捩點。ADK 為開發者社群提供了一套強而有力的工具,挑戰他們超越基礎建設的束縛,專注於創新。我們有理由相信,下一代顛覆性的 AI 應用,將從這裡開始。

--------------------------------------------------------------------------------

資料來源

• CTS | Gemini at Work Edition 2025 | Day 1: LiveLab 1: Get started with Agent Development Kit (ADK)

• CTS | Gemini at Work Edition 2025 | Day 1: LiveLab 2: Build multi-agent systems with ADK

• CTS | Gemini at Work Edition 2025 | Day 1: LiveLabs Introduction

• CTS | Gemini at Work Edition 2025 | Day 2: Featured Demo: Gemini CLI

Read more

AI浪潮下的組織再造:為何「首席生產力長」將是企業的下一個關鍵角色?

AI浪潮下的組織再造:為何「首席生產力長」將是企業的下一個關鍵角色?

近期,《華爾街日報》的報導揭示了一個令人不安的趨勢:大型企業正積極利用人工智慧(AI)處理過去由白領階級執行的任務。然而,這波裁員潮背後有著雙重因素:其一是企業對AI效率的積極擁抱,其二則是對疫情期間過度招聘所進行的一次「預期中的修正」。這股浪潮不僅衝擊了資深員工,也減少了職場新人的機會,在職場中引發了普遍的焦慮感。然而,在這份對未來的擔憂之下,一場更深刻、更具結構性的組織變革正在悄然醞釀。這場變革的核心問題不再是「哪些工作會被取代?」,而是「企業該如何重塑自身,以駕馭人與機器協作的新時代?」 1. 技術革命的核心:為何是「人事部門」站上第一線? 面對 AI 驅動的顛覆性變革,企業的焦點正意外地轉向一個傳統上被視為支援性部門的單位:人力資源部。在這場轉型的核心,人資長(Chief Human Resource Officer, CHRO)的角色正從功能性管理者,演變為企業存續的關鍵策略夥伴。 BCG 的顧問 Julia Dhar 引述其同事 Rishi Varma 的一個絕佳比喻,

By Wesley Tsai
Gemini 3 的「思維簽章」不只是技術升級:關於 AI 責任與信任,你該知道的 5 個驚人真相

Gemini 3 的「思維簽章」不只是技術升級:關於 AI 責任與信任,你該知道的 5 個驚人真相

「職場上需要人類背黑鍋,所以不用擔心 AI 會取代全人類。」這句流傳已久的笑話,或許道出了人類在自動化時代殘存的某種價值。然而,隨著 Google Gemini 3 的推出,其核心的「思維 (Thinking)」機制與「思維簽章 (Thought Signature)」功能,似乎正讓這個玩笑瀕臨失效。這是否意味著人類連背黑鍋的作用都沒有了?答案遠比想像中更複雜,也更發人深省。 1. AI 正式進入「慢思考」時代 諾貝爾獎得主 Daniel Kahneman 曾提出人類心智運作的雙系統理論:「系統 1 (快思)」依賴直覺與反射,而「系統 2 (慢思)」則進行審慎的邏輯推理。過去,所有大型語言模型都像是純粹的「系統 1」生物,其核心任務就是急著預測下一個字,完全憑藉訓練數據中的模式直覺反應。這導致我們必須設計各種複雜的提示詞工程

By Wesley Tsai
深度解析 Gemini 的「思考」引擎:從 Deep Think 到思維簽章的技術與市場變革

深度解析 Gemini 的「思考」引擎:從 Deep Think 到思維簽章的技術與市場變革

1. 導論:從「黑箱」到「可釋義」,AI 思維的下一個疆界 長期以來,大型語言模型 (LLM) 因其難以捉摸的「黑箱問題」而在企業應用中面臨著根本性的信任挑戰。決策者們不禁要問:AI 的建議是源於嚴謹的推導,還是僅僅是訓練數據中的巧合?這種不確定性使得銀行、醫院、律師事務所等高度重視合規與責任的機構,在全面擁抱生成式 AI 的道路上步履維艱。 諾貝爾經濟學獎得主 Daniel Kahneman 曾提出人類思維的「系統 1 (快思)」與「系統 2 (慢思)」理論。過去的 LLM 更像是依賴「系統 1 (快思)」進行快思考,憑藉直覺和模式匹配,條件反射般地預測下一個詞彙。開發者必須透過複雜的提示詞工程,如同教導孩童般,一步步引導模型進行邏輯推理。然而,隨著

By Wesley Tsai
他們不只交付程式碼,更交付「商業」成功:解密 AI 時代最搶手的前線部署工程師 (FDE)

他們不只交付程式碼,更交付「商業」成功:解密 AI 時代最搶手的前線部署工程師 (FDE)

試想一支特種部隊,他們不待在安逸的總部,而是直接空降到客戶所在的「前線戰場」。這不僅是個比喻,這個職位名稱的字源——「前方展開 (Forward Deployed)」——正來自軍事術語,反映了其在高風險、真實環境中作戰的本質。他們不僅攜帶總部最先進的技術平台,更重要的是,他們在塵土飛揚的真實環境中,與客戶並肩作戰,利用現場情報、克服未知障礙,最終達成關鍵的商業任務。這支精銳部隊,就是前線部署工程師 (Forward-Deployed Engineer, FDE)。 FDE並非傳統的軟體工程師或顧問,他們是深入客戶第一線,將頂尖技術實作與敏銳商業策略融為一體的複合型專家。他們不只交付程式碼,更交付商業成功。本文將為您揭開FDE的神秘面紗,深入解析他們的工作模式、核心價值,以及為何在AI浪潮席捲全球的今天,他們成為了科技業最不可或缺的關鍵角色。 1. FDE到底是什麼?不只是「懂技術的顧問」 如果說傳統的技術顧問是繪製作戰地圖的參謀,那麼FDE就是親赴前線、執行任務的特種部隊指揮官。他們的核心特質在於「動手實作」而非「紙上談兵」。FDE會直接進駐客戶的辦公室、工廠,親手編寫生產級別的

By Wesley Tsai