AIGC
AI Agent是什么?
AI Agent,也称为“智能体”,在计算机和人工智能技术领域中,是指那些展现出一种或多种智能特征的软件或硬件实体。这些特征包括自治性、反应性、社会性、预动性、思辨性、认知性等,使其能够在特定环境中自主行动。简单说,AI Agent = 大模型(大脑)+ 记忆系统(存储器)+ 规划模块(指挥官)+ 工具使用 (手脚)。它不是单一技术,而是一套 “让 AI 自主做事” 的系统架构。
OpenAI对AI Agent的定义着重于其作为一个以大型语言模型为核心的系统,这个系统具备自主理解感知、规划、记忆和使用工具的能力,使其能够自动完成复杂的任务。AI Agent的基本框架包含四个主要模块:记忆、规划、工具使用和行动。

记忆(Memory)
此模块负责存储信息,既包括过去的交互和学习到的知识,也包括临时的任务信息。有效的记忆机制对智能体来说至关重要,使其能够在遇到新的或复杂情况时,调用过往的经验和知识。记忆又分为短期和长期两种,短期记忆用于上下文学习,而长期记忆则通过外部数据库和快速检索,为智能体提供长时间保留和回忆信息的能力。
规划(Planning)
规划模块包括事前规划和事后反思两个阶段。事前规划涉及对未来行动的预测和决策,帮助智能体高效地规划步骤和行动以达到目标。事后反思则让智能体能够检查和改进计划中的不足,从错误中学习并加入长期记忆,以此更新对世界的认知。
工具使用(Tool Use)
这一模块使智能体能够利用外部资源或工具执行任务。例如,它们可以调用外部API来获取模型数据中缺失的信息,或者使用特定软件分析大量数据。这种工具使用方式提升了智能体的效率和任务完成能力。
行动(Action)
行动模块是智能体实际执行决策和响应的部分。智能体拥有一系列行动策略,根据不同任务选择相应的行动,如记忆检索、推理、学习和编程等。

AI Agent 的 4 种常见形态
现在 AI Agent 已经不是概念了,很多场景都能看到它的身影,吴恩达把它总结为 4 种核心模式:

反馈模式(Reflection):会 “复盘” 的 AI
做完任务后,会自己检查哪里错了、怎么优化。比如写代码时,AI Agent 生成的代码运行报错,它会自动调试,修正语法错误或逻辑漏洞,不用你手动修改 —— 这就是 ReAct、Self-Refine 等技术的核心。工具调用模式(Tool use):会 “借外力” 的 AI
这是最常用的形态,比如智能客服调用库存系统查商品余量,编程助手调用代码解释器运行 Python 脚本,都是这种模式。规划模式(Planning):会 “做计划” 的 AI
面对复杂任务,先拆步骤再执行。比如前面提到的股票回测、产品对比,都是规划模式的典型应用,核心技术包括分层任务网络(HTN)、思维链(CoT )等。多智能体协作模式(Multi-agent collaboration):会 “团队配合” 的 AI
多个 AI Agent 分工协作,完成更复杂的任务。比如做一个软件开发项目:
产品 Agent 负责整理需求;
架构师 Agent 设计技术方案;
开发 Agent 编写代码;
测试 Agent 调试 BUG;
就像一个虚拟团队,各司其职完成目标。