Midscene 支持缓存 Plan 的步骤与匹配到的元素位置信息,减少 AI 模型的调用次数,从而大幅提升执行效率。请注意,DOM 元素缓存仅在 Web 自动化任务中支持。
效果
当缓存命中时,脚本的执行时间会显著降低。例如在如下案例中,执行耗时从51秒降低到了28秒。


Midscene 的缓存机制基于输入的稳定性和输出的可复用性。当相同的任务指令在相似的页面环境下重复执行时,Midscene 会优先使用已缓存的结果,避免重复调用 AI 模型,从而显著提升执行效率。
缓存的核心机制包括:
ai、aiAction),Midscene 会将 prompt 指令作为缓存键,存储 AI 返回的执行计划aiLocate、aiTap),系统会将定位 prompt 作为缓存键,存储元素的 XPath 信息,下次执行时先验证 XPath 是否仍然有效aiBoolean、aiQuery、aiAssert)不会被缓存缓存内容会保存到 ./midscene_run/cache 目录下,以 .cache.yaml 为扩展名。
如果缓存未命中,Midscene 将会重新调用 AI 模型,并更新缓存文件。
通过配置 cache 选项,你可以为 Agent 启用缓存。