Agent的由来

符号主义 AI（Symbolic AI），常被称为传统人工智能，其核心信念是：智能源于对符号的逻辑操作。这里的符号是人类可读的实体（如词语、概念），操作则遵循严格的逻辑规则。其主要优势在于透明和可解释。由于推理步骤明确，其决策过程可以被完整追溯，这在金融、医疗等高风险领域至关重要。然而，其“阿喀琉斯之踵”在于脆弱性：它依赖于一个完备的规则体系，但在充满模糊和例外的现实世界中，任何未被覆盖的新情况都可能导致系统失灵，这就是所谓的“知识获取瓶颈”。

亚符号主义 AI（Sub-symbolic AI），或称连接主义，则认为知识并非显式的规则，而是内隐地分布在一个由大量神经元组成的复杂网络中，是从海量数据中学习到的统计模式。神经网络和深度学习是其代表。他不是通过学习“猫有四条腿、毛茸茸、会喵喵叫”这样的规则来认识猫的，而是在看过成千上万张猫的图片后，大脑中的神经网络能辨识出“猫”这个概念的视觉模式。这种方法的强大之处在于其模式识别能力和对噪声数据的鲁棒性。它能够轻松处理图像、声音等非结构化数据，这在符号主义 AI 看来是极其困难的任务。然而，这种强大的直觉能力也伴随着不透明性。亚符号主义系统通常被视为一个黑箱（Black Box）。它能以惊人的准确率识别出图片中的猫，但你若问它“为什么你认为这是猫？”，它很可能无法给出一个合乎逻辑的解释。此外，它在纯粹的逻辑推理任务上表现不佳，有时会产生看似合理却事实错误的幻觉。

符号主义试图将人类的知识显式地编码给机器，而联结主义则试图创造出能够像人类一样学习知识的机器。

长久以来，符号主义和亚符号主义这两大阵营如同两条平行线，各自发展。为克服上述两种范式的局限，一种“大和解”的思想开始兴起，这就是神经符号主义 AI（Neuro-Symbolic AI），也称神经符号混合主义。它的目标，是融合两大范式的优点，创造出一个既能像神经网络一样从数据中学习，又能像符号系统一样进行逻辑推理的混合智能体。它试图弥合感知与认知、直觉与理性之间的鸿沟。大语言模型驱动的智能体是神经符号主义的一个极佳实践范例。其内核是一个巨大的神经网络，使其具备模式识别和语言生成能力。然而，当它工作时，它会生成一系列结构化的中间步骤，如思想、计划或 API 调用，这些都是明确的、可操作的符号。通过这种方式，它实现了感知与认知、直觉与理性的初步融合。

符号主义、亚符号主义与神经符号混合主义的知识表示范式：

Agent的分类

Agent VS Workflow

尽管Workflow 和 Agent 都旨在实现任务自动化，但其底层逻辑、核心特征和适用场景却截然不同。简单来说，Workflow 是让 AI 按部就班地执行指令，而 Agent 则是赋予 AI 自由度去自主达成目标。在 AIWorkflow 中 LLM 只是一个节点，它只能盘活一个节点，主导的还是机械化代码，LLM 只是辅助。而在 AIAgent 中 LLM 作为主导，自主判断是否调用工具（机械化代码），主导的是LLM，机械化代码只是辅助。

如图所示，工作流是一种传统的自动化范式，其核心是对一系列任务或步骤进行预先定义的、结构化的编排。它本质上是一个精确的、静态的流程图，规定了在何种条件下、以何种顺序执行哪些操作。整个过程的每一步、每一个判断条件都被精确地预先设定。(符号主义我们传统的编程思维)

与工作流不同，基于大型语言模型的智能体是一个具备自主性的、以目标为导向的系统。它不仅仅是执行预设指令，而是能够在一定程度上理解环境、进行推理、制定计划，并动态地采取行动以达成最终目标。LLM 在其中扮演着“大脑”的角色。一个典型的例子，便是我们创建的智能旅行助手 Nova 。当我们向它下达一个新指令，例如：“明天我要去邵阳，有什么推荐景点吗？” 它的处理过程充分展现了其自主性：

规划与工具调用： Agent 首先会把任务拆解为两个步骤：① 查询天气；② 基于天气推荐景点。随即，它会自主选择并调用“天气查询 API”，并将“邵阳”作为参数传入。(注意在 Nova 的测试案例中，我们也并没有规定要“先查天气”，甚至也没有“要查天气”的指示，这都是 Nova 自主决策的结果)
推理与决策： 假设 API 返回结果为“阴天”。Agent 的 LLM 大脑会基于这个信息进行推理：“需要搜索适合阴天游玩的邵阳景点”。接着，它会根据这个判断，在它的知识库中或再调用其它的搜索引擎工具，筛选出符合要求的景点，如瑶寨、白水洞等。
生成结果： 最后，Agent 会综合信息，给出一个完整的、人性化的回答：“根据查询结果，邵阳明天是阴天，气温11摄氏度。在这样的天气条件下，我为您推荐游览瑶寨。瑶寨在阴天时景色宁静，非常适合摄影和放松，特别是其独特的丹霞地貌在阴天会显得格外迷人。祝您旅途愉快！”

在这个过程中，没有任何写死的if天气=阴天 then 推荐瑶寨的规则。如果天气是“晴天”，Agent 会自主推理并调用合适的工具，最终可能会推荐崀山、南山牧场等景点。这种基于实时信息进行动态推理和决策的能力，正是 Agent 的核心价值所在。

Agent的发展

前置知识了解：

符号主义：专家系统、SHRDLU、ELIZA、“深蓝”计算机

过度时期：“心智社会”理论（去中心化）

联结主义：机器学习/深度学习、反向传播算法、卷积神经网络、Transformer模型

行为主义：强化学习、TD-Gammon、AIphaGo

概念区分：

机器学习/深度学习：静态数据集-预训练(背景知识)-微调(专业知识)-感知问题-学习能力）

强化学习：环境交互数据-专业知识-决策问题-决策能力）

智能体发展演进时间线（未完全版）:

AI Agent 技术栈概览：

现代Agent的基础架构

LLM驱动的智能体核心组件架构：