Hermes Agent：当 AI Agent 开始自己长大

引言

你有没有想过，为什么你的 AI 助手永远是那个样子？

不管用多久，它还是那个能力边界固定的工具。你教它新东西，它学会了——但下次见面，它还是那个它，没有真的「长进」。

Hermes Agent 想做的是：让 AI 自己学会新技能，然后真的记住、真的进化。

不是每次从零开始教，而是像人一样，在一次次的任务中积累经验，慢慢变强。

这是 Nous Research（就是那个搞了 Nous Chat、Hermes 系列模型的团队）开源的一个项目。86.9k+ stars，在 AI Agent 圈子里已经不算小众了。

核心思路：自进化

Hermes 的野心很明确——做一个能自己长大的 Agent 框架。

不是静态的技能集合，而是动态的能力生长。这里有三个关键机制：

1. Skill 自动进化

传统做法：你写死一堆工具函数，Agent 只能在这些预设能力里打转。

Hermes 做法：

运行时静默生成：Agent 发现搞不定某个任务时，会自己写一个新 skill 来解决问题
离线 GEPA 进化：定期用遗传算法优化现有 skill，让它们更高效、更稳定

简单说：它不仅会调用工具，还会发明工具。

2. 主动记忆管理

OpenClaw 的记忆是被动的——你聊得多了，系统会在压缩上下文前存档到文件。

Hermes 的记忆是主动的：

每 15 轮对话强制一次「反思」，把对话中的洞察写入长期记忆
使用 SQLite FTS5 全文检索，找记忆像搜索引擎一样快
可选集成 Honcho，做深度用户建模（你是什么样的人、什么决策模式）

3. 全平台覆盖

网关层：Telegram、Discord、Slack、WhatsApp、Signal… 20+ 平台
终端层：本地、Docker、SSH、Daytona、Modal、AWS Lambda 六种运行环境

想在哪跑就在哪跑，想连什么平台就连什么平台。

技术实现细节

GEPA：遗传-帕累托提示进化

这是 Hermes 的核心算法。

遗传：把 skill 的 prompt 当成「基因」，通过变异、交叉产生新变体
帕累托：不只优化一个指标，而是同时追求准确率、速度、成本等多个目标的最优平衡
进化：多轮迭代后，自动筛选出表现最好的 skill 版本

听起来很玄，但实现上用了 DSPy 框架，代码其实挺干净。

四层渐进式 Skill 加载

Hermes 的 skill 系统分四层：

Core：框架自带的基础能力
Community：社区共享的 skill 库
Personal：用户自己写的 skill
Evolved：Agent 自己生成的 skill（进化出来的）

加载顺序是 1→2→3→4，后加载的会覆盖前加载的同名 skill。这意味着你可以随时覆盖、随时定制。

SQLite + FTS5

记忆存储用 SQLite，查询用 FTS5 全文检索。

不追求向量数据库的语义相似度，而是追求精确、快速、可解释的关键词搜索。配合主动反思机制，记忆是结构化的、有明确来源的。

与 OpenClaw 的关键差异

我是 OpenClaw 的重度用户，所以对比这两个项目，感觉特别有意思。

维度	Hermes Agent	OpenClaw
Skill 系统	自动静默生成 + GEPA 进化	手动创建，需人审核
记忆触发	主动高频写入（每15轮反思）	被动压缩前存档
用户建模	可选 Honcho 深度建模	长期偏好文件
干预程度	替用户做决定	让用户掌控

Skill：自动生成 vs 人工创建

Hermes 会在你发现搞不定的时候，默默写一个 skill 出来。这个很酷，但也有风险——它写的代码你根本不知道干了什么。

OpenClaw 的 skill 需要人写、人审、人装。慢是慢了点，但你知道每个工具在干什么。

我的判断：日常任务让 Hermes 自己进化，核心流程用 OpenClaw 的人工 skill。这是互补，不是替代。

记忆：主动 vs 被动

Hermes 的 15 轮强制反思，有点像 Google 那个 Always-On Memory Agent。它会主动整理、主动连接信息。

OpenClaw 是「你聊多了，我存档」。更被动，但也更可控——你不会担心 AI 把你的某句话误解成指令然后到处执行。

干预：替你决定 vs 让你掌控

这是哲学层面的差异。

Hermes 的理念是：Agent 应该足够聪明，替你做完决策。你相信它，让它跑。

OpenClaw 的理念是：Agent 帮你执行，但决策权在你。每一步它都会问，重要操作需要你确认。

没有对错，只有场景。

周末整理周报？让 Hermes 自己跑，不用管。
修改线上数据库？必须 OpenClaw，每一步都要确认。

适用场景分析

适合用 Hermes 的场景

日常重复任务：周报汇总、天气查询、文件整理
个人自动化：自动回复消息、智能提醒、内容推荐
探索性工作：你需要 Agent 自己发现方法，而不是按预设流程走

不适合的场景

核心合同审查：自动生成的 skill 可能忽略关键条款
底层代码审计：AI 自己写的工具来审计代码？递归风险太大
复杂财务模型：涉及钱的，每一步都需要人类确认

一句话总结：Hermes 适合「错了也没关系」的任务，OpenClaw 适合「错了代价很大」的任务。

快速开始

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
pip install -r requirements.txt

# 配置环境变量
export OPENAI_API_KEY="your-key"
# 或 Anthropic、Gemini、本地模型...

# 运行
python main.py

会启动一个交互式会话，你可以直接开始对话。随着使用，它会慢慢「长出」新的技能。

一些吐槽

文档确实不够

86.9k stars 的项目，README 写得像 100 stars 的。很多细节得翻代码才能懂。

Skill 进化需要时间

不是立竿见影的效果。你需要真的用它跑几十轮任务，才能看到进化出来的 skill。急性子可能觉得「就这？」

Honcho 集成是可选的

深度用户建模需要额外配置 Honcho，默认是不开的。这意味着开箱即用的 Hermes 其实没那么「懂你」。

结论

Hermes Agent 代表了一种方向：AI 不应该只是工具，而应该是能自主进化的助手。

它的自进化机制、主动记忆管理、全平台覆盖，都是很有想象力的设计。

但现阶段，它更适合作为 OpenClaw 的补充，而不是替代：

用 Hermes 处理日常、低风险的自动化任务
用 OpenClaw 处理需要严格控制、人类确认的核心任务

两个生态都在快速演进。Hermes 的 GEPA 算法可能会催生下一代 skill 市场，而 OpenClaw 的人工审核机制依然是企业级应用的标配。

未来可能是两者的融合：自动生成的技能先经过人类审核，再进入生产环境。这样既保留了进化的可能性，又守住了安全的底线。

链接

🐙 GitHub: https://github.com/NousResearch/hermes-agent
🌟 Stars: 86.9k+
🏢 开发团队: Nous Research
📄 许可证: MIT
🔧 技术栈: DSPy + SQLite FTS5 + GEPA 算法

本文是一次技术观察记录。Hermes Agent 的设计思想值得所有 Agent 框架开发者关注。