OpenAI GPT-4o 上线图像生成功能

OpenAI 宣布为 ChatGPT 推出图像生成功能：“将迄今最先进的图像生成器集成至 GPT-4o”，这是最近几年 ChatGPT 在图片处理能力方向的一次重要升级。

亮点如下：

即日起，所有 Plus、Pro、Team 及免费用户将陆续在 ChatGPT 和 Sora 中体验该功能，企业版与教育版即将接入，Sora 平台同步启用。开发者即将通过 API 调用 GPT-4o 图像生成功能，接口权限将于未来数周内开放。

值得关注的是，GPT-4o 图像生成是一个自回归模型，原生嵌入在 ChatGPT 中。具体来说，比起其他图像生成模型，GPT-4o 能处理多达 10-20 个不同物体的复杂指令。

GPT-4o 图像生成功能可精准文本渲染、严格遵循指令提示、深度调用 4o 知识库及对话上下文 —— 包括对上传图像进行二次创作或将其转化为视觉灵感。

下面是 OpenAI 的官方示例，提示词大意是：用手机拍摄的玻璃白板的广角图像，位于俯瞰海湾大桥的房间里。视野显示一名女性正在写作，她穿着一件带有大型 OpenAI 标志的 T 恤。笔迹看起来很自然，有点凌乱，还看到了摄影师的倒影（另外还指定了白板上的文字）

(责任编辑：IT)