使用 iOS Playground 快速体验
通过使用 Midscene.js iOS 设备,你可以快速在 iOS 设备上体验 Midscene 的主要功能,而无需编写任何代码。
该 Playground 和 @midscene/ios 包共享一份代码,因此你可以将其视为 Midscene iOS SDK 的一个 Playground 或调试工具。

准备工作
安装 Node.js
安装 Node.js 18 或以上版本。
准备 API Key
准备一个视觉语言(VL)模型的 API Key。
你可以在 选择 AI 模型 文档中查看 Midscene.js 支持的模型和配置。
准备 WebDriver 服务
在开始之前,你需要先设置 iOS 开发环境:
- macOS(iOS 开发必需)
- Xcode 和 Xcode 命令行工具
- iOS 模拟器或真机设备
配置环境
在使用 Midscene iOS 之前,需要先准备 WebDriverAgent 服务。请参考官方文档进行设置:
验证环境配置
配置完成后,可以通过访问 WebDriverAgent 的状态接口来验证 服务是否启动:
访问地址:http://localhost:8100/status
正确响应示例:
{
"value": {
"build": {
"version": "10.1.1",
"time": "Sep 24 2025 18:56:41",
"productBundleIdentifier": "com.facebook.WebDriverAgentRunner"
},
"os": {
"testmanagerdVersion": 65535,
"name": "iOS",
"sdkVersion": "26.0",
"version": "26.0"
},
"device": "iphone",
"ios": {
"ip": "10.91.115.63"
},
"message": "WebDriverAgent is ready to accept commands",
"state": "success",
"ready": true
},
"sessionId": "BCAD9603-F714-447C-A9E6-07D58267966B"
}
如果能够正常访问该端点并返回类似上述的 JSON 响应,说明 WebDriverAgent 已经正确配置并运行。
启动 Playground
npx --yes @midscene/ios-playground
配置 API Key
点击齿轮按钮,进入配置页面:

参考 配置模型和服务商 文档,配置 API Key。
开始体验
配置完成后,你可以立即开始使用 Midscene。它提供了多个关键操作 Tab,包括但不限于:
- Action: 与网页进行交互,这就是所谓的自动规划(Auto Planning)。比如
提取页面中的用户 ID,返回 \{ id: string \}
- Tap: 在某个元素上点击,这就是所谓的即时操作(Instant Action)。
所有 Agent API 都能在 Playground 上直接调试和运行!交互、提取、验证三大类方法全覆盖,可视化操作和验证,让你的自动化开发效率飙升。
快来试试吧!
关于自动规划(Auto Planning)和即时操作(Instant Action)的区别,请参考 API 文档。
想将 Midscene 集成到代码?
插件体验结束后,你可能想将 Midscene 集成到代码中。这里有几种不同集成形式的文档: