跳转到主要内容
图像生成功能让agent能够根据文本提示词生成新图像,或编辑用户上传的图像。agent会根据用户的请求和可用上下文,在生成与编辑之间进行选择。

启用图像生成

图像生成功能需通过智能体构建器中的 添加工具 模态框添加 (而不是 Capabilities 部分) 。点击智能体构建器面板底部的 添加工具,然后添加一种图像模型工具,例如 OpenAI Image ToolsDALL-E-3Stable Diffusion。agent 会根据请求选择合适的工具,或者你也可以在说明中限制其使用。

生成

当用户请求图像时,agent会使用提示词调用生成工具,并直接内联返回生成的图像。agent还会在其上下文中保留该图像的引用,以便在同一对话中描述或复用它。

编辑

如果用户上传一张图片并请求进行修改——例如更改颜色、添加对象或扩展构图——agent会调用该工具的编辑版本。输出会按要求替换相应区域,或在原图基础上进行扩展。

注意事项

  • 生成的图像不会自动进入单独的视觉分析流程。如果你需要 agent 解读 图像,请使用带有用户上传图像的 视觉
  • 提供商的内容政策同样适用。违反提供商政策的提示词返回的是错误,而不是图像。
最后修改于 2026年6月10日