赋予你的智能体通过 Gemini Computer Use 模型和 Playwright 控制浏览器,从而自动化 Web 浏览器任务的能力。
当你需要智能体导航网站并执行 UI 操作时
当你想要自动化复杂的、多步骤的基于浏览器的工工作流时
当你需要为高风险的在线操作集成安全确认时
提供浏览器自动化任务的目标或提示词
指定起始 URL 和智能体循环的步数限制
如果需要,配置浏览器通道或自定义可执行文件路径
如果启用了安全确认,请查看并确认任何高风险操作
你
查找 example.com 上最新的博客文章标题并总结它。
Agent
我将启动一个受 Playwright 控制的浏览器,导航至 example.com,并识别最新的博客文章。我将捕获屏幕截图以分析 UI,点击文章链接,然后为你提取并总结内容。你可以随着我执行每一步通过智能体循环观察进度。
Gives your agent the ability to automate browser interactions for web testing, form filling, data extraction, and authenticated browsing using local or cloud-based sessions.
赋予您的代理使用 Expo DOM 组件在原生平台的 Webview 中运行 Web 代码的能力。
让您的智能体能够通过 Gemini Web API 生成文本和图像,支持多轮对话和基于视觉的图像输入。
赋予您的代理按照组合和复合组件等现代模式构建可重用 React 组件的能力。
赋予你的智能体使用公司既定格式编写专业内部沟通内容(如进度报告、简报和领导层更新)的能力。