持久化执行
草稿 约 4 分钟阅读
持久化执行
概述
持久化执行(Durable Execution)是一种保证长时运行任务在失败后可恢复的执行模式。其核心思想是将任务的状态和进度持久化存储,在进程崩溃、机器宕机或网络中断后能够从断点继续执行,而非从头开始。这一技术对 AI 工作流(长时运行、易失败)具有重大意义。
工作原理
flowchart TB
Start[任务开始] --> Checkpoint[创建 Checkpoint]
Checkpoint --> Execute[执行任务步骤]
Execute --> Success{成功?}
Success -->|是| Next{还有更多步骤?}
Success -->|否| Recover[从 Checkpoint 恢复]
Recover --> Execute
Next -->|是| Checkpoint
Next -->|否| Complete[任务完成]
关键机制:
- Checkpoint(检查点) — 定期将任务状态(局部变量、调用栈、待处理事件)序列化到持久存储
- 重放(Replay) — 恢复时从最近的 Checkpoint 重建执行上下文
- 幂等性保证 — 外部调用的副作用通过去重机制保证只执行一次
关键变体
| 变体 | 年份 | 代表项目 | 核心特点 |
|---|---|---|---|
| Temporal | 2019 | temporalio/temporal | 独立的持久化执行工作流引擎,支持多种语言 SDK |
| Durable Functions | 2017 | Azure Functions | 微软将持久化执行集成到无服务器函数中 |
| pg_durable | 2026 | [[pg-durable | microsoft/pg_durable]] |
最新进展
- 2026-06-08 | 微软开源 pg-durable|pg_durable,将持久化执行引擎植入 PostgreSQL,标志着 AI 工作流所需的”可恢复执行”正从应用层下沉到数据库层 | 来源: GitHub Trending
相关概念
- agent-frameworks — AI Agent 的长时运行任务是持久化执行的核心应用场景
相关实体
- microsoft — pg_durable 的发布方
- pg-durable — 微软开源的 PostgreSQL 持久化执行扩展
来源引用
| 日期 | 报告 | 关键发现 |
|---|---|---|
| 2026-06-08 | GitHub Trending | 微软 pg_durable 开源,持久化执行下沉到数据库层 |