赋予您的代理自动化浏览器任务的能力,例如使用 CLI 导航网站、填写表单、捕获屏幕截图以及提取数据。
当您需要从现代 Web 应用程序中抓取数据时
当您想要自动化重复的表单提交或登录时
当您需要对网站进行全页或带注释的屏幕截图时
告诉代理要打开哪个 URL 或要执行什么任务
等待代理获取快照并识别元素
查看代理执行的交互,如点击、填写或选择
通过屏幕截图或数据提取确认最终状态
你
我需要登录我的 GitHub 账户并列出我所有的私有仓库。
Agent
我将使用浏览器导航到 GitHub 的登录页面,识别电子邮件和密码字段,并安全地填写它们。登录后,我将导航到您的个人资料页面,获取仓库列表的快照,并为您将所有私有仓库的名称提取到一个清晰的列表中。我甚至可以提供屏幕截图来确认我们已成功访问仪表板。
Gives your agent the ability to automate browser interactions for web testing, form filling, data extraction, and authenticated browsing using local or cloud-based sessions.
让你的智能体能够快速构建并部署具有内置工具流、审批和生成式组件的现代 AI 聊天界面。
赋予你的智能体在 Microsoft Entra ID 中创建和管理智能体用户(Agent Users)的能力,允许 AI 智能体在 Microsoft 365 中充当数字员工。
让你的智能体能够运行超过 150 种基于云的 AI 应用,涵盖图像生成、视频创建、网络搜索和社交媒体自动化。
使您的代理能够预见您的需求、在上下文丢失时恢复状态,并通过结构化协议持续改进。