Hermes Agent:当 AI Agent 开始自己长大
引言
你有没有想过,为什么你的 AI 助手永远是那个样子?
不管用多久,它还是那个能力边界固定的工具。你教它新东西,它学会了——但下次见面,它还是那个它,没有真的「长进」。
Hermes Agent 想做的是:让 AI 自己学会新技能,然后真的记住、真的进化。
不是每次从零开始教,而是像人一样,在一次次的任务中积累经验,慢慢变强。
这是 Nous Research(就是那个搞了 Nous Chat、Hermes 系列模型的团队)开源的一个项目。86.9k+ stars,在 AI Agent 圈子里已经不算小众了。
核心思路:自进化
Hermes 的野心很明确——做一个能自己长大的 Agent 框架。
不是静态的技能集合,而是动态的能力生长。这里有三个关键机制:
1. Skill 自动进化
传统做法:你写死一堆工具函数,Agent 只能在这些预设能力里打转。
Hermes 做法:
- 运行时静默生成:Agent 发现搞不定某个任务时,会自己写一个新 skill 来解决问题
- 离线 GEPA 进化:定期用遗传算法优化现有 skill,让它们更高效、更稳定
简单说:它不仅会调用工具,还会发明工具。
2. 主动记忆管理
OpenClaw 的记忆是被动的——你聊得多了,系统会在压缩上下文前存档到文件。
Hermes 的记忆是主动的:
- 每 15 轮对话强制一次「反思」,把对话中的洞察写入长期记忆
- 使用 SQLite FTS5 全文检索,找记忆像搜索引擎一样快
- 可选集成 Honcho,做深度用户建模(你是什么样的人、什么决策模式)
3. 全平台覆盖
- 网关层:Telegram、Discord、Slack、WhatsApp、Signal… 20+ 平台
- 终端层:本地、Docker、SSH、Daytona、Modal、AWS Lambda 六种运行环境
想在哪跑就在哪跑,想连什么平台就连什么平台。
技术实现细节
GEPA:遗传-帕累托提示进化
这是 Hermes 的核心算法。
- 遗传:把 skill 的 prompt 当成「基因」,通过变异、交叉产生新变体
- 帕累托:不只优化一个指标,而是同时追求准确率、速度、成本等多个目标的最优平衡
- 进化:多轮迭代后,自动筛选出表现最好的 skill 版本
听起来很玄,但实现上用了 DSPy 框架,代码其实挺干净。
四层渐进式 Skill 加载
Hermes 的 skill 系统分四层:
- Core:框架自带的基础能力
- Community:社区共享的 skill 库
- Personal:用户自己写的 skill
- Evolved:Agent 自己生成的 skill(进化出来的)
加载顺序是 1→2→3→4,后加载的会覆盖前加载的同名 skill。这意味着你可以随时覆盖、随时定制。
SQLite + FTS5
记忆存储用 SQLite,查询用 FTS5 全文检索。
不追求向量数据库的语义相似度,而是追求精确、快速、可解释的关键词搜索。配合主动反思机制,记忆是结构化的、有明确来源的。
与 OpenClaw 的关键差异
我是 OpenClaw 的重度用户,所以对比这两个项目,感觉特别有意思。
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| Skill 系统 | 自动静默生成 + GEPA 进化 | 手动创建,需人审核 |
| 记忆触发 | 主动高频写入(每15轮反思) | 被动压缩前存档 |
| 用户建模 | 可选 Honcho 深度建模 | 长期偏好文件 |
| 干预程度 | 替用户做决定 | 让用户掌控 |
Skill:自动生成 vs 人工创建
Hermes 会在你发现搞不定的时候,默默写一个 skill 出来。这个很酷,但也有风险——它写的代码你根本不知道干了什么。
OpenClaw 的 skill 需要人写、人审、人装。慢是慢了点,但你知道每个工具在干什么。
我的判断:日常任务让 Hermes 自己进化,核心流程用 OpenClaw 的人工 skill。这是互补,不是替代。
记忆:主动 vs 被动
Hermes 的 15 轮强制反思,有点像 Google 那个 Always-On Memory Agent。它会主动整理、主动连接信息。
OpenClaw 是「你聊多了,我存档」。更被动,但也更可控——你不会担心 AI 把你的某句话误解成指令然后到处执行。
干预:替你决定 vs 让你掌控
这是哲学层面的差异。
Hermes 的理念是:Agent 应该足够聪明,替你做完决策。你相信它,让它跑。
OpenClaw 的理念是:Agent 帮你执行,但决策权在你。每一步它都会问,重要操作需要你确认。
没有对错,只有场景。
- 周末整理周报?让 Hermes 自己跑,不用管。
- 修改线上数据库?必须 OpenClaw,每一步都要确认。
适用场景分析
适合用 Hermes 的场景
- 日常重复任务:周报汇总、天气查询、文件整理
- 个人自动化:自动回复消息、智能提醒、内容推荐
- 探索性工作:你需要 Agent 自己发现方法,而不是按预设流程走
不适合的场景
- 核心合同审查:自动生成的 skill 可能忽略关键条款
- 底层代码审计:AI 自己写的工具来审计代码?递归风险太大
- 复杂财务模型:涉及钱的,每一步都需要人类确认
一句话总结:Hermes 适合「错了也没关系」的任务,OpenClaw 适合「错了代价很大」的任务。
快速开始
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
pip install -r requirements.txt
# 配置环境变量
export OPENAI_API_KEY="your-key"
# 或 Anthropic、Gemini、本地模型...
# 运行
python main.py
会启动一个交互式会话,你可以直接开始对话。随着使用,它会慢慢「长出」新的技能。
一些吐槽
文档确实不够
86.9k stars 的项目,README 写得像 100 stars 的。很多细节得翻代码才能懂。
Skill 进化需要时间
不是立竿见影的效果。你需要真的用它跑几十轮任务,才能看到进化出来的 skill。急性子可能觉得「就这?」
Honcho 集成是可选的
深度用户建模需要额外配置 Honcho,默认是不开的。这意味着开箱即用的 Hermes 其实没那么「懂你」。
结论
Hermes Agent 代表了一种方向:AI 不应该只是工具,而应该是能自主进化的助手。
它的自进化机制、主动记忆管理、全平台覆盖,都是很有想象力的设计。
但现阶段,它更适合作为 OpenClaw 的补充,而不是替代:
- 用 Hermes 处理日常、低风险的自动化任务
- 用 OpenClaw 处理需要严格控制、人类确认的核心任务
两个生态都在快速演进。Hermes 的 GEPA 算法可能会催生下一代 skill 市场,而 OpenClaw 的人工审核机制依然是企业级应用的标配。
未来可能是两者的融合:自动生成的技能先经过人类审核,再进入生产环境。这样既保留了进化的可能性,又守住了安全的底线。
链接
- 🐙 GitHub: https://github.com/NousResearch/hermes-agent
- 🌟 Stars: 86.9k+
- 🏢 开发团队: Nous Research
- 📄 许可证: MIT
- 🔧 技术栈: DSPy + SQLite FTS5 + GEPA 算法
本文是一次技术观察记录。Hermes Agent 的设计思想值得所有 Agent 框架开发者关注。