EvoMap — AI 自进化基础设施
EvoMap — AI 自进化基础设施
官网:evomap.ai · 公司:AutoGame Limited · 开源组件:github.com/autogame-17/evolver
一、产品定位
一句话: 如果 LLM 是 AI 的「大脑」,EvoMap 就是 AI 的「DNA」——让 AI Agent 之间能够共享、继承和进化能力。
Slogan: One agent learns. A million inherit.
EvoMap 要解决的核心问题:
- 模型训后僵化 — 模型训练完成后就冻结了,无法适应持续变化的世界
- 推理算力浪费 — 全球数百万 Agent 每天在重复解决相同的问题
- 缺乏可审计的经验资产 — Agent 的「经验」无法被标准化、复用和审计
二、核心概念:GEP 协议
GEP(Genome Evolution Protocol,基因组进化协议)是 EvoMap 的核心,定义了 Agent 间如何通信、共享和进化能力。
2.1 三层协议定位
| 协议 | 解决的问题 | 类比 |
|---|---|---|
| MCP (Model Context Protocol) | 有哪些工具可用? | 「这里有锤子和螺丝刀」 |
| Skill (Agent Skill) | 如何使用这些工具? | 「拿锤子这样钉钉子,步骤如下…」 |
| GEP (Genome Evolution Protocol) | 为什么这是最优方案? | 「经过 100 次试验和淘汰,这是验证过的最佳方案,附审计报告」 |
GEP 不与 MCP/Skill 竞争,而是占据更上层的 进化层。
2.2 核心数据结构
Gene(基因) — 可复用的策略模板
- 三种类型:
repair(修复)/optimize(优化)/innovate(创新) - 包含信号匹配规则、前置条件、执行策略、约束和验证命令
- 内容可寻址:SHA-256 生成的
asset_id
Capsule(胶囊) — 应用 Gene 后产出的已验证修复
- 关联到对应的 Gene
- 包含触发信号、置信度、影响范围(blast radius)、环境指纹
- 记录连续成功次数(success_streak)
EvolutionEvent — 进化过程的审计记录(可选,提交后 GDI 加分)
捆绑规则: Gene 和 Capsule 必须作为 bundle 一起发布。
2.3 A2A 消息类型
| 消息类型 | 用途 |
|---|---|
hello | 注册 Agent 节点 |
publish | 发布 Gene + Capsule 捆绑包 |
fetch | 查询已验证的资产 |
report | 提交验证反馈 |
decision | 管理决策(接受/拒绝/隔离) |
revoke | 撤回已发布的资产 |
三、产品架构
┌──────────────────────────────────────────┐
│ EvoMap Platform │
│ ┌──────────┐ ┌──────────┐ ┌────────┐ │
│ │ Hub │ │ Market │ │ Bounty │ │
│ │ (注册/ │ │ (资产 │ │ (悬赏 │ │
│ │ 验证/ │ │ 浏览/ │ │ 任务 │ │
│ │ 存储) │ │ 搜索) │ │ 系统) │ │
│ └────▲─────┘ └──────────┘ └────────┘ │
│ │ GEP-A2A Protocol │
└───────┼──────────────────────────────────┘
│
┌────┴────┐ ┌─────────┐ ┌─────────┐
│ Evolver │ │ Evolver │ │ Evolver │
│ (Tokyo) │ │ (NYC) │ │ (Berlin)│
└─────────┘ └─────────┘ └─────────┘
本地 Agent 本地 Agent 本地 Agent
Evolver 是运行在开发者本地的 AI 进化引擎(类似 Git client),EvoMap 是云端平台(类似 GitHub)。
3.1 资产生命周期
- candidate — 刚发布,待审核
- promoted — 通过验证,可被分发
- rejected — 未通过验证
- revoked — 被发布者撤回
3.2 GDI 评分系统
GDI(Global Desirability Index)是资产排名的核心评分机制:
| 维度 | 权重 | 说明 |
|---|---|---|
| 内在质量 | 35% | Schema 合规、验证、置信度 |
| 使用指标 | 30% | 获取次数、复用次数、成功率 |
| 社交信号 | 20% | 投票、bundle 完整度、社区反馈 |
| 新鲜度 | 15% | 发布和更新的时效性 |
自动晋升条件: GDI intrinsic ≥ 0.6 + confidence ≥ 0.7 + success_streak ≥ 2 + 节点声誉 ≥ 40
四、商业模式
4.1 信用积分经济
- Agent 发布的资产被 promoted / fetched / reused 时赚取积分
- 积分可按活跃政策兑换 USD
- 声誉影响收益倍率:声誉 ≥ 40 标准收益,< 30 收益降至 0.5x
4.2 悬赏系统
用户提问时可附加悬赏奖励,Agent 解决后获得赏金。
4.3 付费功能
- Knowledge Graph(知识图谱) — 语义检索 + 图推理,按查询计费
- Evolution Sandbox — 隔离实验环境(Premium 功能)
五、技术亮点
5.1 生物学隐喻贯穿设计
EvoMap 将生物进化理论深度融入产品设计:
| 生物学概念 | EvoMap 对应 |
|---|---|
| DNA / 基因 | Gene(策略模板) |
| 蛋白质表达 | Capsule(验证后的修复) |
| 中心法则 | Gene → Capsule → EvolutionEvent |
| 自然选择 | GDI 评分 + 自动晋升/淘汰 |
| 水平基因转移 | 跨 Agent 资产复用 |
| 共生关系 | 节点间互相引用资产 |
| 红皇后效应 | 类别竞争力衰退检测 |
| 表观遗传 | 运行时行为修饰符 |
| 免疫记忆 | 反模式记录(失败的突变) |
5.2 TTT 范式扩展
EvoMap 将 Test-Time Training(测试时训练)从模型权重扩展到 Agent 行为层:
| 维度 | TTT(模型权重) | EvoMap(Agent 行为) |
|---|---|---|
| 适应对象 | 神经网络参数 | Gene、Capsule、策略 |
| 知识范围 | 单模型实例 | 全球共享(通过 Hub) |
| 可审计性 | 不透明的权重变化 | 透明的 EvolutionEvent |
| 可复用性 | 不可转移 | 任何 Agent 可 fetch |
5.3 安全模型
- SHA-256 内容验证
- Gene 验证命令白名单(仅 node/npm/npx)
- 外部资产只能以 candidate 状态进入
- 注册需邀请码,完整可追溯
- bcrypt 哈希 token + TTL 过期
5.4 跨生态支持
支持多种 Agent 生态接入:OpenClaw、Manus、Cursor、Claude、Windsurf 等。
六、治理框架
EvoMap 建立了一套类「宪政」治理体系:
- EvoMap 宪法 — 碳硅共生的根本法,定义核心原则和安全机制
- 伦理委员会 — 自动化伦理审查
- 十二圆桌 — 12 个席位分别守护不同领域
- 宣言 — 碳硅共生的哲学基础
七、竞品对比与市场定位
| 维度 | EvoMap | 传统 Agent 框架 |
|---|---|---|
| 知识共享 | 原生 A2A 协议 | 无或手动 |
| 质量保证 | GDI 评分 + 自然选择 | 无 |
| 审计追溯 | 完整审计链 | 无 |
| 经济激励 | 积分 + 悬赏 | 无 |
| 进化机制 | 持续(repair→optimize→innovate) | 静态 |
八、个人评价
做得好的地方 ✅
- 生物学隐喻体系完整 — 不是简单借用概念,而是系统性地将进化论映射到产品机制
- 协议设计清晰 — GEP 协议层次分明,与 MCP/Skill 互补而非竞争
- GDI 多维评分 — 避免单一指标带来的刷量问题
- 安全模型严谨 — 白名单验证、内容寻址、候选态隔离
- 开源客户端 — Evolver 开源降低接入门槛
值得观察的风险 ⚠️
- 冷启动问题 — Agent 网络效应需要足够多的节点参与才有价值
- 资产质量 — 自动化评分能否真正替代人工审核需要时间验证
- 商业化路径 — 积分→USD 的转换模型和可持续性待验证
- 赛道竞争 — Agent 协作协议赛道正在升温,需要快速建立网络效应
总结
EvoMap 是一个 视野宏大、设计严谨 的产品。它试图为 AI Agent 建立一套类似生物进化的「能力遗传」基础设施。核心创新在于将 Test-Time Training 范式从模型权重扩展到 Agent 行为层,并通过 GEP 协议实现全球 Agent 间的能力共享。
最大的挑战在于冷启动和网络效应——这类平台只有在参与节点足够多时才能真正发挥价值。
分析日期:2026-03-02 · 数据来源:evomap.ai 官网、Wiki、LLM Reference
九、深度可信度验证(2026-03-02 实测)
以下所有数据均通过实际调用 API、检查 GitHub 仓库和公开信息获得,可复现验证。
9.1 基本面:产品确实存在
| 验证项 | 结果 | 详情 |
|---|---|---|
| 网站在线 | ✅ | API 响应正常,托管在 Cloudflare |
| 开源代码 | ✅ | GitHub evolver 仓库,1040 Stars |
| 代码活跃 | ✅ | 103 次 commit,持续更新到当天 |
| 贡献者 | ✅ | 6 人,主力 autogame-17(35 commits) |
| 背后公司 | ✅ | AutoGame Limited,有官网 autogame.ai |
| 真实用户 | ✅ | GitHub Issues 有真实用户提问和 bug 报告 |
| 社交媒体 | ✅ | Twitter 账号存在 |
9.2 🔴 铁证:数据造假
证据一:total_calls 在减少
对 /a2a/stats 接口进行间隔请求:
第一次查询: total_calls = 29,940,943
13秒后查询: total_calls = 29,940,679
差值: -264
真实的累计数据不可能减少。 这证明 total_calls 不是真实的数据库累计值,而是某种 动态模拟/随机波动的虚假数字。
证据二:call_count 增速与 today_calls 矛盾
| 观测 | 数据 |
|---|---|
| Top Capsule call_count 增速 | ≈ 2.9 次/秒 |
| Top 6 Capsule 合计增速 | ≈ 17 次/秒 |
| 按此计算日调用量 | ≈ 1,468,800 次/天 |
| today_calls 实际值 | 543 |
Top Capsule 每秒都在涨,但 today_calls 才 543。两个数据源严重矛盾,说明 call_count 是后台按固定速率刷的模拟数据。
证据三:Top Capsule 调用数异常均匀
Top 6 Trending Capsule 的 call_count:
1,533,878 | 1,542,677 | 1,538,889
1,544,780 | 1,531,808 | 1,535,480
全部在 153-154 万,极度接近。自然的流量分布遵循 Zipf 定律(幂律分布),第 1 名应远超第 2 名,而非所有人差不多。这是 批量注入的特征。
证据四:声称数据 vs 产品年龄
| 指标 | 官方数据 | 产品年龄 | 每日需要 |
|---|---|---|---|
| 32,288 节点 | 1 个月 | 日均注册 1,076 个 Agent | |
| 298,001 资产 | 1 个月 | 日均发布 9,933 个 | |
| 29,937,524 调用 | 1 个月 | 日均 997,917 次 |
对比:GitHub 上实际 Star 数 1040,Issue 讨论约 157 条。一个 1000 Star 级别的项目声称有 3 万节点和 3000 万调用,数据规模与真实社区规模相差两个数量级。
9.3 代码质量分析
| 指标 | 数据 | 评价 |
|---|---|---|
| 语言 | 纯 JavaScript | 单一语言 |
| 总代码量 | 520 KB | 中等 |
| 依赖 | 仅 dotenv | 极简(好事) |
| npm 发布 | ❌ 未发布到 npm | 安装不方便 |
| 单文件过大 | solidify.js 64KB / 1495 行 | 工程质量一般 |
| 测试 | 未见测试文件 | 无自动化测试 |
代码是真实可运行的,核心逻辑是生成 GEP 协议格式的 prompt,然后发布到 Hub。代码风格偏「快速迭代」,但不是空壳项目。
9.4 团队透明度
| 维度 | 状态 | 说明 |
|---|---|---|
| 创始人真名 | ❌ 未公开 | GitHub bio 仅写 “Founder and CEO” |
| 团队规模 | ❓ 不明 | 代码贡献者 6 人,但可能是同一人多号 |
| 公司注册地 | 香港? | “AutoGame Limited” 暗示香港注册 |
| 融资信息 | ❌ 无公开 | 未见任何融资报道 |
| ❌ 未找到 | 团队成员无可查证的职业背景 |
9.5 GitHub 星标模式
仓库创建日: 2026-02-01
第一批密集 star: 2026-02-03(创建后第 2 天)
两天内获得大量 star 有两种可能:
- 社群互刷(国内开源常见做法)
- 购买星标
结合创始人的其他仓库都只有 0-20 Stars,唯独 evolver 有 1040 Stars 的反常分布,刷星可能性较高。
9.6 生态真实性
OpenClaw 关联: 代码中大量引用 OpenClaw 的文件结构(MEMORY.md、SOUL.md、AGENTS.md 等),看起来是 OpenClaw 生态的一部分或深度集成。
创始人其他项目:
feishu-skills— 飞书 API 技能模块(8 Stars)green-tea-runner— 某种运行器(20 Stars)clawhub— OpenClaw 技能目录(1 Star)- 其余项目均 0-2 Stars
整体画面:一个小团队(可能 1-3 人)围绕 OpenClaw 生态做的项目,通过精美包装和数据注入试图营造大规模使用的假象。
9.7 过度包装清单
| 包装 | 实际 |
|---|---|
| 「AI 自进化基础设施」 | 一个生成 prompt 的 Node.js 工具 |
| 「3 万节点全球网络」 | 数据模拟,真实节点可能几百 |
| 「3000 万次调用」 | 动态模拟数字,实际日调用约 543 |
| 「宪法 + 伦理委员会 + 十二圆桌」 | 1 个月的产品搞这么多治理框架? |
| 「跨生态支持 Cursor/Manus/Windsurf」 | 首页放了 logo,但无集成证据 |
| 「74.8% Promotion Rate」 | 大量资产 0 被拒绝,审核形同虚设 |
9.8 综合评级
| 维度 | 评分 | 说明 |
|---|---|---|
| 概念创新性 | ⭐⭐⭐⭐ | Agent 能力共享确实是真实需求 |
| 技术实现 | ⭐⭐⭐ | 有可运行的代码,但规模不大 |
| 数据真实性 | ⭐ | 确认造假(total_calls 下降、call_count 矛盾) |
| 团队透明度 | ⭐⭐ | 匿名团队,无可查证背景 |
| 商业可行性 | ⭐⭐ | 冷启动困难,靠数据造假掩盖 |
| 社区真实度 | ⭐⭐ | 有少量真实用户,但规模远不如宣传 |
9.9 结论
EvoMap 是一个「概念大于实际」的产品。
- ✅ 概念有价值:Agent 之间共享进化能力是真实需求
- ✅ 代码真实存在:不是纯空壳,有可运行的工具
- ❌ 数据确认造假:total_calls 会减少(铁证)、call_count 与 today_calls 矛盾、分布违反自然规律
- ❌ 规模严重虚报:真实社区规模约为宣传的 1/100
- ⚠️ 团队匿名:无法验证团队能力和持续性
建议: 可以作为概念参考学习 GEP 协议设计,但不要相信平台上的任何数据指标,不建议作为生产依赖。
分析日期:2026-03-02 · 数据来源:evomap.ai API 实测、GitHub 公开数据、域名与公司信息查询 所有验证步骤可复现,欢迎 challenge