让您的智能体能够通过 Gemini Web API 生成文本和图像,支持多轮对话和基于视觉的图像输入。
当您需要从文本提示词生成图像的后端时
当您想使用具备视觉能力的 AI 来描述或修改现有图像时
当您需要支持会话持久化的多轮 AI 对话时
接受使用逆向工程 API 的强制性知情免责声明
提供用于生成文本或图像的提示词或提示词文件
指定模型(pro、flash 或 thinking)和可选的参考图像
获取生成的文本、图像文件或结构化的 JSON 输出
你
根据这段描述,使用 Gemini 生成一张高质量的未来实验室图像。
Agent
我将首先验证您是否同意使用 Gemini Web 客户端。一旦接受,我将使用 'gemini-3-pro' 模型来处理您的实验室描述。我将启动图像生成任务并将结果文件保存为 'generated.png'。我还会提供会话 ID,以便您可以继续要求修改图像或询问有关场景的问题。
让您的智能体能够将 X (Twitter) 推文、合集(Threads)和文章转换为带有 YAML 前置元数据(front matter)的整洁 Markdown 文件,并支持可选的媒体下载。
Gives your agent the ability to create original educational and biographical comics with consistent characters and detailed panel layouts.
赋予你的智能体通过 Gemini Computer Use 模型和 Playwright 控制浏览器,从而自动化 Web 浏览器任务的能力。
让您的智能体能够通过结合各种信息布局和高质量视觉风格,生成专业、可直接发表的信息图。
让您的智能体能够为文章生成精美的、五维度的自定义封面图,具备专业的排版和氛围控制。