AI News Daily
← Wiki / 概念

持久化执行

草稿 约 4 分钟阅读

持久化执行

概述

持久化执行(Durable Execution)是一种保证长时运行任务在失败后可恢复的执行模式。其核心思想是将任务的状态和进度持久化存储,在进程崩溃、机器宕机或网络中断后能够从断点继续执行,而非从头开始。这一技术对 AI 工作流(长时运行、易失败)具有重大意义。

工作原理

flowchart TB
    Start[任务开始] --> Checkpoint[创建 Checkpoint]
    Checkpoint --> Execute[执行任务步骤]
    Execute --> Success{成功?}
    Success -->|是| Next{还有更多步骤?}
    Success -->|否| Recover[从 Checkpoint 恢复]
    Recover --> Execute
    Next -->|是| Checkpoint
    Next -->|否| Complete[任务完成]

关键机制:

  1. Checkpoint(检查点) — 定期将任务状态(局部变量、调用栈、待处理事件)序列化到持久存储
  2. 重放(Replay) — 恢复时从最近的 Checkpoint 重建执行上下文
  3. 幂等性保证 — 外部调用的副作用通过去重机制保证只执行一次

关键变体

变体年份代表项目核心特点
Temporal2019temporalio/temporal独立的持久化执行工作流引擎,支持多种语言 SDK
Durable Functions2017Azure Functions微软将持久化执行集成到无服务器函数中
pg_durable2026[[pg-durablemicrosoft/pg_durable]]

最新进展

相关概念

相关实体

来源引用

日期报告关键发现
2026-06-08GitHub Trending微软 pg_durable 开源,持久化执行下沉到数据库层