如何打造 OpenAI 的 AI Agent:什麼是 AI Agent

#AI agent #OpenAI
如何打造 OpenAI 的 AI Agent:什麼是 AI Agent
五倍技術部
技術文章
如何打造 OpenAI 的 AI Agent:什麼是 AI Agent

前些時候,OpenAI 悄悄地發布一篇名為 A Practical Guide to Building Agents 的 AI Agent 引導指南。
(A Practical Guide to Building Agents)

短短 36 頁的篇幅裡,可以將內容區分為四個重點:
* 什麼是 Agent
* 什麼時候適合使用 Agent
* 設計 Agent 時的基礎概念
* Agent 應諄遵守的行為守則
我們也透過幾篇文章,一邊詳閱這份引導指南,一邊嘗試打造一個簡單的 AI Agent。

什麼是 Agent?

OpenAI 在文章中簡單定義了什麼是 AI Agent — — Agents are systems that independently accomplish tasks on your behalf. (Agent 是一個能夠代替使用者自主完成任務的獨立系統。)

與我們單純使用 ChatGPT 不同的地方在於,ChatGPT 更像是一個超級聰明的聊天機器人,而 AI Agent 更像是一個超級助理,可以自行針對任務所需找到對應的工具,並且使用這些工具完成任務。

Agent 是怎麼運作的?

剛剛有說到,AI Agent 像是一個超級助理,自行透過 LLM(大型語言模型)這顆大腦來判斷每個任務適合使用的工具,但和傳統聊天機器人(chatbot)不同的地方在於,聊天機器人所有的行為都是由工程師在背後設計一系列的 if / else 流程控制,在規範好的框架內與使用者進行互動,超出了工程師所設計的框架後,聊天機器人就無法繼續進行互動。

而 AI Agent 則會有一個工作流程(workflow),這個 workflow 在文章中被定義為「為了達成使用者的目標,所需要被執行的一系列步驟」,經由這個 workflow 完成使用者交付的任務,像是訂餐、修改代碼等。

A workflow is sequence of steps that must be executed to meet the user’s goal.

所以像 ChatGPT 或是聊天機器人,由於它們單純只能回答問題,卻沒有自主控制工作流程的能力,我們也不會將之稱作 Agent。
當 AI Agent 在執行任務的過程中遇到困難時,它也嘗試透過其他方式來解決問題,像是收集更多的資訊、呼叫叫外部的工具,如果真的遇到無法自主排除的失敗時,Agent 會將控制權交還給使用者,讓使用者判斷該如何進行下一步。

在這份文件中,提及了一點很重要的規範 — — Agent 可以以自主性地針對任務選擇適合的工具,並且在明確規範的守則內(clearly defined guardrails)執行這些工具。

什麼時候適合使用 Agent?

對於一般的使用者來說,ChatGPT 的能力已經遠遠超過過往聊天機器人所能提供,然而說穿了,ChatGPT 也只能一來一回地回答問題,如果今天我們需要它完成像是「幫我訂一份披薩」、「幫我修改一下代碼」等任務,ChatGPT 就會顯得無能為力,畢竟它只能回答問題,卻無法自主完成任務。

在引導指南中,以調查詐欺案件為例,過往工程師會針對常見的詐欺手法,歸納出一張檢查清單,程式只會順著這個檢查清單逐個篩選出可疑的交易行為,但大型語言模型代理(LLM Agent)可以像是一位經驗豐富的調查員,能夠根據交談的前後文,靈活地觀察其模式變化,甚至可以針對「看似沒有違反規則但仍然可疑」的狀況進行判斷,也就是這些「模糊、複雜」的情境,凸顯了 Agent 的優勢所在。

三種適合使用 AI Agent 的情境

在引導指南中,提到了三種適合使用 AI Agent 的情境:

  • 決策複雜的情境(Complex decision-making):需要根據前後文進行「細微地判斷」與「例外處理」(例如:客服退費的審核流程)
  • 難以維護的規則(Difficult-to-maintain rules):系統中過於複雜的規則,導致每次更新容易發生錯誤。(例如:廠商安全審查流程)
  • 需要解讀非結構化的資料(Heavy reliance on unstructured data):需要處理自然語言、理解文件、使用者對話等情境。(例如:處理保險理賠) 在我們開始真正開發 AI Agent 之前,可以先預想後續的使用情境是否符合上述三種情境之一,如果不是的話,根據引導指南的建議,可以考慮使用傳統的「規則自動化」系統(類似聊天機器人),而不用特意打造一個 AI Agent。 (像叫 AI 畫畫這件事,看起來就不需要 AI Agent。(但我需要一個封面))

本文同步發佈於作者的 Medium 網站