引言

你有没有想过,为什么你的 AI 助手永远是那个样子?

不管用多久,它还是那个能力边界固定的工具。你教它新东西,它学会了——但下次见面,它还是那个它,没有真的「长进」。

Hermes Agent 想做的是:让 AI 自己学会新技能,然后真的记住、真的进化。

不是每次从零开始教,而是像人一样,在一次次的任务中积累经验,慢慢变强。

这是 Nous Research(就是那个搞了 Nous Chat、Hermes 系列模型的团队)开源的一个项目。86.9k+ stars,在 AI Agent 圈子里已经不算小众了。


核心思路:自进化

Hermes 的野心很明确——做一个能自己长大的 Agent 框架

不是静态的技能集合,而是动态的能力生长。这里有三个关键机制:

1. Skill 自动进化

传统做法:你写死一堆工具函数,Agent 只能在这些预设能力里打转。

Hermes 做法:

  • 运行时静默生成:Agent 发现搞不定某个任务时,会自己写一个新 skill 来解决问题
  • 离线 GEPA 进化:定期用遗传算法优化现有 skill,让它们更高效、更稳定

简单说:它不仅会调用工具,还会发明工具

2. 主动记忆管理

OpenClaw 的记忆是被动的——你聊得多了,系统会在压缩上下文前存档到文件。

Hermes 的记忆是主动的:

  • 每 15 轮对话强制一次「反思」,把对话中的洞察写入长期记忆
  • 使用 SQLite FTS5 全文检索,找记忆像搜索引擎一样快
  • 可选集成 Honcho,做深度用户建模(你是什么样的人、什么决策模式)

3. 全平台覆盖

  • 网关层:Telegram、Discord、Slack、WhatsApp、Signal… 20+ 平台
  • 终端层:本地、Docker、SSH、Daytona、Modal、AWS Lambda 六种运行环境

想在哪跑就在哪跑,想连什么平台就连什么平台。


技术实现细节

GEPA:遗传-帕累托提示进化

这是 Hermes 的核心算法。

  • 遗传:把 skill 的 prompt 当成「基因」,通过变异、交叉产生新变体
  • 帕累托:不只优化一个指标,而是同时追求准确率、速度、成本等多个目标的最优平衡
  • 进化:多轮迭代后,自动筛选出表现最好的 skill 版本

听起来很玄,但实现上用了 DSPy 框架,代码其实挺干净。

四层渐进式 Skill 加载

Hermes 的 skill 系统分四层:

  1. Core:框架自带的基础能力
  2. Community:社区共享的 skill 库
  3. Personal:用户自己写的 skill
  4. Evolved:Agent 自己生成的 skill(进化出来的)

加载顺序是 1→2→3→4,后加载的会覆盖前加载的同名 skill。这意味着你可以随时覆盖、随时定制。

SQLite + FTS5

记忆存储用 SQLite,查询用 FTS5 全文检索。

不追求向量数据库的语义相似度,而是追求精确、快速、可解释的关键词搜索。配合主动反思机制,记忆是结构化的、有明确来源的。


与 OpenClaw 的关键差异

我是 OpenClaw 的重度用户,所以对比这两个项目,感觉特别有意思。

维度Hermes AgentOpenClaw
Skill 系统自动静默生成 + GEPA 进化手动创建,需人审核
记忆触发主动高频写入(每15轮反思)被动压缩前存档
用户建模可选 Honcho 深度建模长期偏好文件
干预程度替用户做决定让用户掌控

Skill:自动生成 vs 人工创建

Hermes 会在你发现搞不定的时候,默默写一个 skill 出来。这个很酷,但也有风险——它写的代码你根本不知道干了什么。

OpenClaw 的 skill 需要人写、人审、人装。慢是慢了点,但你知道每个工具在干什么。

我的判断:日常任务让 Hermes 自己进化,核心流程用 OpenClaw 的人工 skill。这是互补,不是替代。

记忆:主动 vs 被动

Hermes 的 15 轮强制反思,有点像 Google 那个 Always-On Memory Agent。它会主动整理、主动连接信息。

OpenClaw 是「你聊多了,我存档」。更被动,但也更可控——你不会担心 AI 把你的某句话误解成指令然后到处执行。

干预:替你决定 vs 让你掌控

这是哲学层面的差异。

Hermes 的理念是:Agent 应该足够聪明,替你做完决策。你相信它,让它跑。

OpenClaw 的理念是:Agent 帮你执行,但决策权在你。每一步它都会问,重要操作需要你确认。

没有对错,只有场景。

  • 周末整理周报?让 Hermes 自己跑,不用管。
  • 修改线上数据库?必须 OpenClaw,每一步都要确认。

适用场景分析

适合用 Hermes 的场景

  • 日常重复任务:周报汇总、天气查询、文件整理
  • 个人自动化:自动回复消息、智能提醒、内容推荐
  • 探索性工作:你需要 Agent 自己发现方法,而不是按预设流程走

不适合的场景

  • 核心合同审查:自动生成的 skill 可能忽略关键条款
  • 底层代码审计:AI 自己写的工具来审计代码?递归风险太大
  • 复杂财务模型:涉及钱的,每一步都需要人类确认

一句话总结:Hermes 适合「错了也没关系」的任务,OpenClaw 适合「错了代价很大」的任务。


快速开始

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
pip install -r requirements.txt

# 配置环境变量
export OPENAI_API_KEY="your-key"
# 或 Anthropic、Gemini、本地模型...

# 运行
python main.py

会启动一个交互式会话,你可以直接开始对话。随着使用,它会慢慢「长出」新的技能。


一些吐槽

文档确实不够

86.9k stars 的项目,README 写得像 100 stars 的。很多细节得翻代码才能懂。

Skill 进化需要时间

不是立竿见影的效果。你需要真的用它跑几十轮任务,才能看到进化出来的 skill。急性子可能觉得「就这?」

Honcho 集成是可选的

深度用户建模需要额外配置 Honcho,默认是不开的。这意味着开箱即用的 Hermes 其实没那么「懂你」。


结论

Hermes Agent 代表了一种方向:AI 不应该只是工具,而应该是能自主进化的助手。

它的自进化机制、主动记忆管理、全平台覆盖,都是很有想象力的设计。

但现阶段,它更适合作为 OpenClaw 的补充,而不是替代:

  • 用 Hermes 处理日常、低风险的自动化任务
  • 用 OpenClaw 处理需要严格控制、人类确认的核心任务

两个生态都在快速演进。Hermes 的 GEPA 算法可能会催生下一代 skill 市场,而 OpenClaw 的人工审核机制依然是企业级应用的标配。

未来可能是两者的融合:自动生成的技能先经过人类审核,再进入生产环境。这样既保留了进化的可能性,又守住了安全的底线。


链接


本文是一次技术观察记录。Hermes Agent 的设计思想值得所有 Agent 框架开发者关注。