我就问：没有一致性的分布式同步，哪来的“超级终端”体验？

《零基础学鸿蒙：分布式数据一致性实战指南》摘要本文从鸿蒙开发者视角剖析分布式数据一致性实现方案。核心观点：一致性需根据场景分层设计，区分分布式数据对象（实时同步）与分布式数据库（持久化存储）。文章提出三大实战策略：数据建模：按字段类型划分核心状态、偏好状态与可衍生数据，采用LWW、CRDT等差异化冲突策略；同步机制：组合实时推送、延迟批量与按需拉取三种模式，通过Topic实现分级同步；版本

兰瓶Coding

1351人浏览 · 2025-11-03 19:45:25

兰瓶Coding · 2025-11-03 19:45:25 发布

我是兰瓶Coding，一枚刚踏入鸿蒙领域的转型小白，原是移动开发中级，如下是我学习笔记《零基础学鸿蒙》，若对你所有帮助，还请不吝啬的给个大大的赞~

前言 🧩

直给你结论：一致性不是一个“全开全关”的开关，而是一套按场景切档的策略组合。在鸿蒙/开源 OpenHarmony 生态里，常见的分布式数据对象（DDO）与分布式数据库/键值存储（DDB/DKV） 各有边界：

DDO：更像对象层的实时协作总线（状态变更订阅、端端同步丝滑）。
DDB/DKV：更偏持久化与冲突检测（端云/端端皆可接，适合结构化或 Key-Value 的可追溯写入）。

这篇，咱把数据对象建模、同步策略（实时/延迟/按需）、版本控制与合并、弱网/离线恢复、端云/端端拓扑选择，统统拎出来讲透，并给你可直接抄用的合并代码与恢复流程脚本。上车！😎

1. 模型先行：把“会打架”的字段提前拆开

1.1 领域对象分层

Core State（核心状态）：强一致或准强一致（订单金额、权限位）。
User Preference（偏好状态）：最终一致即可（主题、视图、排序）。
Derived/Cache（可再生）：不参与冲突（统计、索引、快照）。

1.2 字段级冲突策略（设计期就写在模型旁！）

字段	类型	冲突策略	备注
`displayName`	string	LWW（Last-Write-Wins，带逻辑时钟）	简单字段别复杂化
`tags`	set	OR-Set（可加可删、无重）	用 CRDT 免手写对冲
`steps`	number	PN-Counter（正负计数）	更适合“增减”场景
`lastSeenAt`	timestamp	Max-Clock	取最大即可
`notes[]`	list	RGA/WOOT（序列 CRDT）	真·多人编辑才上
`status`	enum	自定义优先级（例如 `Approved > Pending > Draft`）	业务上“谁压谁”写清楚

经验谈：别妄想一种策略走天下。字段级策略矩阵才是王道。

2. 同步策略：实时 / 延迟 / 按需，别一把梭

2.1 三档策略何时上

实时（push/subscription）：互动强、协作密（多人看同一条记录、穿戴端秒级反馈）。
延迟（定时批/Lazy）：“能晚则晚”的业务（日志、非关键偏好）。
按需（on-demand）：深链直达、冷门大对象（只拉当前页必要数据）。

2.2 多档同存一个对象（分 Topic 同步）

UserProfile
 ├─ core: {status, role, quota}        -> 实时/强校验
 ├─ pref: {theme, sort, filters}       -> 延迟（30s 批推）
 └─ cache: {computedStats, thumbnails} -> 按需（打开详情才拉）

3. 版本控制与合并：从“猜测”到“可证明”

3.1 版本标识三件套

Lamport Clock：lc = max(local, remote) + 1，简单好用。
Vector Clock：每设备一个计数，可判断并发/因果。
Op Log（操作日志）：记录“意图”，支持重放与压缩。

3.2 统一变更封包（端端/端云都吃得下）

type DeviceId = string;

type Mutation =
  | { kind: 'set'  ; field: 'displayName'; value: string }
  | { kind: 'add'  ; field: 'tags'       ; value: string }
  | { kind: 'remove'; field: 'tags'      ; value: string }
  | { kind: 'inc'  ; field: 'steps'      ; delta: number }
  | { kind: 'setEnum'; field: 'status'   ; value: 'Draft'|'Pending'|'Approved' };

interface Change {
  id: string;            // 对象ID
  by: DeviceId;
  clock: Record<DeviceId, number>; // Vector Clock
  at: number;            // 物理时间，仅辅助
  mutations: Mutation[];
}

3.3 合并器（示例：TypeScript/ArkTS 同构可用）

type Obj = {
  displayName: string;
  tags: Set<string>;
  steps: { p: Record<string, number>, n: Record<string, number> }; // PN-Counter
  status: 'Draft'|'Pending'|'Approved';
  _clock: Record<string, number>;
};

const STATUS_PRIORITY = { Draft: 1, Pending: 2, Approved: 3 };

function dominates(a: Record<string,number>, b: Record<string,number>) {
  // a >= b 且至少一个维度 >
  let ge = true, gt = false;
  for (const k of new Set([...Object.keys(a), ...Object.keys(b)])) {
    const av = a[k] || 0, bv = b[k] || 0;
    if (av < bv) ge = false;
    if (av > bv) gt = true;
  }
  return ge && gt;
}

export function merge(base: Obj, incoming: Change): Obj {
  // 1) 快速因果判断：若已包含或被支配，直接丢弃/接受
  if (dominates(base._clock, incoming.clock)) return base; // 已包含或更“新”
  // 2) 应用 mutation（字段级策略）
  const draft: Obj = { ...base,
    tags: new Set(base.tags),
    steps: { p: { ...base.steps.p }, n: { ...base.steps.n } },
    _clock: { ...base._clock }
  };

  for (const m of incoming.mutations) {
    switch (m.kind) {
      case 'set':
        // LWW：用 (clock, at) 决定，简化写法：vector 不支配时默认接受
        (draft as any)[m.field] = m.value;
        break;
      case 'add':
        draft.tags.add(m.value);
        break;
      case 'remove':
        // OR-Set 需带 tag-id，这里简化为“可删可加”的软实现
        draft.tags.delete(m.value);
        break;
      case 'inc':
        draft.steps.p[incoming.by] = (draft.steps.p[incoming.by]||0) + Math.max(0,m.delta);
        draft.steps.n[incoming.by] = (draft.steps.n[incoming.by]||0) + Math.max(0,-m.delta);
        break;
      case 'setEnum':
        // 优先级并行收敛
        const old = draft.status;
        draft.status = (STATUS_PRIORITY[m.value] >= STATUS_PRIORITY[old]) ? m.value : old;
        break;
    }
  }

  // 3) 推进向量时钟
  for (const k in incoming.clock) {
    draft._clock[k] = Math.max(draft._clock[k]||0, incoming.clock[k]);
  }
  return draft;
}

export function readPn(steps: Obj['steps']) {
  const sum = (m: Record<string, number>) => Object.values(m).reduce((a,b)=>a+b,0);
  return sum(steps.p) - sum(steps.n);
}

要点：

字段策略 ≠ 全局策略，合并器里逐条 Mutation处理；

向量时钟用来判断是否“并发”；并发时走字段策略；

回放安全：同一 Change 重放不改变结果（幂等）。

4. 弱网 / 离线恢复：别让“临时断网”变“永久脏数据”

4.1 端侧三层缓冲

Mem Store（热态）：界面响应。
OpLog（持久队列）：离线堆积，可回放。
Snapshot（周期快照）：快速重建，防日志过长。

// 端侧上传队列（指数退避 + 冲突回放）
async function drain(oplog: Change[], send: (c:Change)=>Promise<void>) {
  let backoff = 1000;
  for (const change of oplog) {
    while (true) {
      try { await send(change); break; }
      catch (e) {
        await sleep(backoff);
        backoff = Math.min(backoff * 2, 30000);
      }
    }
  }
}

4.2 恢复流程（端云/端端同理）

重连 → 拉取自上次 clock 的“差量” → 本地回放变更 → 上报本地未上行的变更
    ↘ 若出现并发冲突 → 按字段策略合并 → 写回快照 → 广播订阅端

4.3 日志清理

边界：向量时钟“全体至少看过”那一刻前的变更可压缩为快照。
阈值：日志>10k 或 >24h 未压缩 → 触发 snapshot+truncate。

5. 端云 / 端端拓扑：怎么选更“顺手”

5.1 端端（P2P/DDO）

适用：近场协作、家庭/办公“超级终端”共享、低延迟交互。
一致性：因果一致 + 最终收敛足够；用 CRDT/向量时钟。
风险：多端离线时间长，历史回放成本上升（要靠快照限流）。

5.2 端云（中枢/汇聚）

适用：多地多终端、需要审计/访问控制/长久存档。
一致性：可选中心化仲裁（乐观锁/租约），对关键写做强约束。
风险：中心点可用性；要做断点续传与灰度仲裁（例如只对 status 字段强一致，其它最终一致）。

5.3 混合（推荐）

控制面（Control Plane） 走云：账号/权限/重要状态强一致；
数据面（Data Plane） 端端直连：高频状态最终一致，降低时延与云成本。

6. “强一致片段”怎么做：租约 + 条件写（示例）

对必须“唯一真相”的字段（如 status 由审批人置位），用短租约 + 条件更新。

伪代码（服务端）

// 条件写：如果对象版本号未变化才更新
async function updateStatus(id: string, expectClock: string, next: 'Approved'|'Pending') {
  const row = await loadRow(id);
  if (row.clock !== expectClock) throw new Error('conflict');
  const nextClock = bump(row.clock); // lamport++
  await db.tx(async t => {
    await t.update('obj', { id }, { status: next, clock: nextClock });
    await t.insert('changelog', { id, change: /*...*/, clock: nextClock });
  });
  return nextClock;
}

端侧补偿

写失败（409/412）→ 拉差量 → 本地合并 → 用户可选“覆盖重试/放弃”。
UI 明示：这里非“自动解决”，避免悄悄 LWW 抹掉真实意图。

7. DDO/DDB 接入思路（工程落地指南）

不同版本 SDK 名称略有差异，下述是模式与粘合层，把一致性放在你可控的合并器里。

7.1 DDO（对象订阅）作为“发布总线”

端端近场：DDO 负责订阅与广播对象变更；
你在 DDO 回调里生成 Change → 喂给合并器 → 写入本地快照 + 上行。

7.2 DDB/DKV 作为“持久与回放源”

写入时同时写 changelog（追加表/流）；
端侧重连靠clock 拉差量；
定期snapshot+truncate。

Changelog 表（建议）

CREATE TABLE changelog (
  obj_id     text,
  clk        jsonb,      -- 向量时钟
  by         text,
  at         timestamptz,
  mutations  jsonb,
  PRIMARY KEY (obj_id, at, by) -- 简化
);
CREATE INDEX ON changelog (obj_id);

8. 观测与测试：没数据的“一致性”都不可靠

8.1 关键指标

收敛时延：最后一次并发写 → 全端一致的时间（P95）。
冲突率：每千次写入出现并发冲突的比例。
恢复成功率：弱网/断连后 1 分钟内完成重放的比例。
日志膨胀度：平均对象的 op log 条数；快照压缩频次。

8.2 混沌/分区测试脚本（端侧）

// 伪代码：制造并发 + 人为延迟
await Promise.all([
  deviceA.write({ kind:'set', field:'displayName', value:'Alice' }, delay=1200),
  deviceB.write({ kind:'set', field:'displayName', value:'Alicia' }, delay=800),
  deviceC.write({ kind:'add', field:'tags', value:'pro' }, delay=200),
]);
// 断网 -> 本地累计 100 条 -> 重连 -> 观测收敛 & 合并策略是否如预期

9. 端到端示例：从变更到收敛（小闭环）

用户在穿戴端把 steps += 120，生成：

{
  "id": "user:42",
  "by": "watchA",
  "clock": { "watchA": 7 },
  "mutations": [{ "kind": "inc", "field": "steps", "delta": 120 }],
  "at": 1730000000000
}