AIGC

Posted on 2025-12-06 In AI

AI Agent是什么？

AI Agent，也称为“智能体”，在计算机和人工智能技术领域中，是指那些展现出一种或多种智能特征的软件或硬件实体。这些特征包括自治性、反应性、社会性、预动性、思辨性、认知性等，使其能够在特定环境中自主行动。简单说，AI Agent = 大模型（大脑）+ 记忆系统（存储器）+ 规划模块（指挥官）+ 工具使用（手脚）。它不是单一技术，而是一套 “让 AI 自主做事” 的系统架构。

OpenAI对AI Agent的定义着重于其作为一个以大型语言模型为核心的系统，这个系统具备自主理解感知、规划、记忆和使用工具的能力，使其能够自动完成复杂的任务。AI Agent的基本框架包含四个主要模块：记忆、规划、工具使用和行动。

记忆（Memory）

此模块负责存储信息，既包括过去的交互和学习到的知识，也包括临时的任务信息。有效的记忆机制对智能体来说至关重要，使其能够在遇到新的或复杂情况时，调用过往的经验和知识。记忆又分为短期和长期两种，短期记忆用于上下文学习，而长期记忆则通过外部数据库和快速检索，为智能体提供长时间保留和回忆信息的能力。

规划（Planning）

规划模块包括事前规划和事后反思两个阶段。事前规划涉及对未来行动的预测和决策，帮助智能体高效地规划步骤和行动以达到目标。事后反思则让智能体能够检查和改进计划中的不足，从错误中学习并加入长期记忆，以此更新对世界的认知。

工具使用（Tool Use）

这一模块使智能体能够利用外部资源或工具执行任务。例如，它们可以调用外部API来获取模型数据中缺失的信息，或者使用特定软件分析大量数据。这种工具使用方式提升了智能体的效率和任务完成能力。

行动（Action）

行动模块是智能体实际执行决策和响应的部分。智能体拥有一系列行动策略，根据不同任务选择相应的行动，如记忆检索、推理、学习和编程等。

AI Agent 的 4 种常见形态

现在 AI Agent 已经不是概念了，很多场景都能看到它的身影，吴恩达把它总结为 4 种核心模式：

反馈模式（Reflection）：会 “复盘” 的 AI
做完任务后，会自己检查哪里错了、怎么优化。比如写代码时，AI Agent 生成的代码运行报错，它会自动调试，修正语法错误或逻辑漏洞，不用你手动修改 —— 这就是 ReAct、Self-Refine 等技术的核心。
工具调用模式（Tool use）：会 “借外力” 的 AI
这是最常用的形态，比如智能客服调用库存系统查商品余量，编程助手调用代码解释器运行 Python 脚本，都是这种模式。
规划模式（Planning）：会 “做计划” 的 AI
面对复杂任务，先拆步骤再执行。比如前面提到的股票回测、产品对比，都是规划模式的典型应用，核心技术包括分层任务网络（HTN）、思维链（CoT ）等。
多智能体协作模式（Multi-agent collaboration）：会 “团队配合” 的 AI
多个 AI Agent 分工协作，完成更复杂的任务。比如做一个软件开发项目：

产品 Agent 负责整理需求；
架构师 Agent 设计技术方案；
开发 Agent 编写代码；
测试 Agent 调试 BUG；
就像一个虚拟团队，各司其职完成目标。