CQRS和事件溯源：过度设计还是必要演进

Posted by quentin 在 Friday, 10 April 2026

博客分类:

当我们谈论现代架构模式时，CQRS（命令查询职责分离）和事件溯源（Event Sourcing）经常被一起提及，就像它们是某种"高级架构套装"。但真相是，这两个模式既不是银弹，也不是毒药——它们是工具，而工具的价值取决于你用它解决什么问题。

从一个真实场景说起

想象你正在开发一个电商订单系统。传统的 CRUD 设计很直接：订单表存储当前状态，用户下单就 INSERT，修改订单就 UPDATE。一切看起来都很完美，直到产品经理走过来说：

"我们需要知道每个订单的完整修改历史，包括谁在什么时候改了什么。"

你的第一反应可能是加个审计日志表。但接下来：

"我们还需要实时的数据分析仪表板，显示订单状态分布、转化率、热力图……而且不能影响订单处理的性能。"

这时候，传统的单一数据模型开始显得捉襟见肘。读写混合在同一个数据结构上，写操作需要完整性约束，读操作需要复杂的聚合查询，它们的需求根本不在同一个频道上。

这就是 CQRS 和事件溯源试图解决的问题——但它们真的是最优解吗?

CQRS：分离不等于复杂

命令查询职责分离的核心思想很简单：写操作（Command）和读操作（Query）使用不同的模型。但"分离"这个词容易让人误解——它不意味着你必须用两个数据库、两套代码、两个团队。

CQRS 的三个层次：

1. 逻辑分离（最轻量）

在同一个数据库里，写操作使用规范化的事务表，读操作使用物化视图或 OLAP 表。这只是数据库设计的最佳实践，谈不上什么"架构模式"。

```sql
-- 写模型：规范化设计
CREATE TABLE orders (id, user_id, status, created_at);
CREATE TABLE order_items (id, order_id, product_id, quantity);

-- 读模型：反规范化视图
CREATE MATERIALIZED VIEW order_summary AS
SELECT o.id, o.user_id, o.status,
COUNT(i.id) as item_count,
SUM(i.quantity * p.price) as total_amount
FROM orders o
JOIN order_items i ON o.id = i.order_id
JOIN products p ON i.product_id = p.id
GROUP BY o.id;
```

这种程度的"CQRS"几乎没有成本，却能显著提升查询性能。如果你的系统还没做到这一点，先做这个，别谈什么事件溯源。

2. 物理分离（中等复杂度）

读写使用不同的数据存储技术。比如写入到 PostgreSQL，同步到 Elasticsearch 供搜索查询。这需要处理同步延迟和一致性问题，但收益也很明显——你可以为不同的访问模式选择最合适的存储。

关键问题是同步机制：
- CDC (Change Data Capture)：从数据库事务日志读取变更
- 消息队列：写操作发布事件到 Kafka，读模型订阅消费
- 双写 + 最终一致性：应用层同时写两个库（容易出问题，不推荐）

3. 完全分离的领域模型（最复杂）

写模型用 DDD 的聚合根和领域模型，读模型用扁平的 DTO。两者在代码层面完全解耦，各自演进。

这个层次才是多数人理解的"CQRS"，但也是最容易过度设计的地方。除非你的读写逻辑真的需要独立演进（比如写模型有复杂的业务规则，读模型需要频繁变化的查询结构），否则这种分离的维护成本远超收益。

事件溯源：时间机器还是噩梦？

如果说 CQRS 是关于"空间分离"（读写分离），事件溯源就是关于"时间不变性"（不删除历史）。它不存储当前状态，而是存储所有导致当前状态的事件序列。

一个订单的事件流可能是：
```
OrderCreated -> {orderId: 123, userId: 456, items: [...]}
ItemAdded -> {orderId: 123, productId: 789, quantity: 2}
ShippingAddressSet -> {orderId: 123, address: "..."}
OrderSubmitted -> {orderId: 123, timestamp: "..."}
PaymentProcessed -> {orderId: 123, amount: 299.99, method: "card"}
OrderShipped -> {orderId: 123, trackingNumber: "..."}
```

要知道订单当前状态？回放（Replay）所有事件。这听起来像是数据库的"git commit history"——你可以回到任何时间点，查看系统当时的状态。

事件溯源的真正价值

很多人被"时间旅行"和"完美审计日志"吸引，但这些其实是副产品。事件溯源的核心价值在于：

1. 事件即事实：捕获业务发生了什么，而不是当前是什么。这对于需要追溯因果关系的系统（金融、医疗、供应链）至关重要。

2. 解耦时序依赖：传统系统里，你必须先完成 A 才能做 B。事件溯源允许你先记录"A 发生了"，稍后再处理 B 的逻辑。这对于分布式系统的最终一致性是天然契合的。

3. 灵活的投影（Projection）：同一个事件流可以投影成多个读模型。新需求来了？写个新的投影函数，重放历史事件，立刻得到新的视图。不需要数据迁移。

但代价是什么？

事件溯源的隐藏成本

1. 查询成本暴增：每次查询都要回放事件？性能灾难。所以你必须维护快照（Snapshot）——每隔 N 个事件存一次当前状态。但这又回到了状态存储的老路上，只是多了一层抽象。

2. 事件版本管理：业务变更意味着事件结构变化。你如何处理两年前的 `OrderCreated` 事件（版本 1）和今天的 `OrderCreated` 事件（版本 3）？版本兼容、迁移、向上转换（Upcasting）…… 这些问题比数据库 schema 迁移复杂得多。

3. 调试地狱：出 bug 了，你得追踪哪个事件导致了错误状态。如果事件链有 500 个事件，祝你好运。而且事件一旦存储，理论上不可变——修复 bug 意味着发布"补偿事件"，而不是直接改数据。

4. 团队认知负担：新人加入团队，必须理解"不要直接改状态，发事件"这个思维模式。这不仅是技术问题，更是思维习惯的转变。

什么时候你真的需要它们？

不要为了"高级"而用 CQRS/ES。 问自己这些问题：

你需要 CQRS 吗？

✅ 需要，如果：
- 读写频率差异巨大（比如 1:100 的读多写少场景）
- 读写的数据结构差异明显（写需要强一致性，读需要复杂聚合）
- 读写的扩展需求不同（读需要水平扩展，写需要垂直扩展）

❌ 不需要，如果：
- 你的应用还在 MVP 阶段，用户不到 10 万
- 大部分查询都是"通过 ID 查单个对象"
- 团队对分布式系统和最终一致性没有足够经验

你需要事件溯源吗？

✅ 需要，如果：
- 业务本质上是事件驱动的（订单流转、工作流审批、物流追踪）
- 审计和合规是核心需求（金融交易、医疗记录）
- 需要时间旅行查询（"显示 3 个月前所有处于'待支付'状态的订单"）
- 系统需要支持多个异构的下游消费者（分析、报表、通知、同步到外部系统）

❌ 不需要，如果：
- 你只是想要审计日志（加个 audit 表就够了）
- 当前状态是业务关心的全部（大部分 CRUD 应用）
- 团队对函数式编程和不可变数据结构不熟悉
- 你还没搞清楚领域边界在哪里（事件溯源要求清晰的聚合根设计）

混合策略：不是非黑即白

真实世界的架构很少是纯粹的某一种模式。更实用的做法是：

1. 核心领域用事件溯源：订单处理、支付流程等核心业务逻辑，用事件溯源保证数据一致性和可追溯性。

2. 支撑域用传统 CRUD：用户资料、产品目录等相对静态的数据，用传统的表结构。

3. 读模型用混合存储：关系型数据库存事务数据，Redis 缓存热点数据，Elasticsearch 支持全文搜索，ClickHouse 做 OLAP 分析。

4. 逐步演进，而非一步到位：先从数据库视图开始做读写分离，验证效果后再考虑引入消息队列、事件存储等重型基础设施。

结论：工具服务于问题，而非相反

CQRS 和事件溯源不是"更高级"的架构，它们是解决特定问题的工具。如果你的系统没有读写冲突、没有复杂的历史追溯需求、没有多个异构消费者，那么传统的 CRUD + 关系型数据库依然是最简单有效的方案。

技术决策的核心不是"用什么技术显得专业"，而是"用最简单的方案解决当前的问题，同时为未来的演进留有空间"。

记住：
- 过早的抽象是万恶之源，过度的架构同样如此。
- 不要因为技术文章都在谈 CQRS/ES，就觉得不用它们是落后的。
- 如果你的团队连数据库索引都还没优化好，先别想着事件溯源。

架构的价值在于支撑业务，而不是炫技。当你真正遇到了 CQRS/ES 能解决的问题时，你会自然而然地走向它们——而不是因为它们很酷。

---

思考题：
- 你的系统中，哪些部分是真正需要"完整历史"的？哪些只需要"当前状态"？
- 如果明天要加一个新的报表需求，你是修改现有查询逻辑，还是新建一个独立的读模型？
- 团队成员能否理解"最终一致性"这个概念？如果不能，你准备好教育成本了吗？

坤霆@全栈技术研究室

不论你在什么时候开始，重要的是开始之后就不要停止。
不论你在什么时候结束，重要的是结束之后就不要悔恨。

CQRS和事件溯源：过度设计还是必要演进

添加新评论

Plain text