OpenAI GPT-4o 上线图像生成功能
时间:2025-03-28 16:52 来源:未知 作者:IT
OpenAI 宣布为 ChatGPT 推出图像生成功能:“将迄今最先进的图像生成器集成至 GPT-4o”,这是最近几年 ChatGPT 在图片处理能力方向的一次重要升级。
亮点如下:
-
能够精确渲染文本内容
-
支持多模态输入输出 (文本、图像、音频)
-
能理解复杂指令并结合上下文
-
能创建具有真实感的第一人称视角图像
-
遵循指令,可以处理上传的图片并进行编辑或风格转换
即日起,所有 Plus、Pro、Team 及免费用户将陆续在 ChatGPT 和 Sora 中体验该功能,企业版与教育版即将接入,Sora 平台同步启用。开发者即将通过 API 调用 GPT-4o 图像生成功能,接口权限将于未来数周内开放。
值得关注的是,GPT-4o 图像生成是一个自回归模型,原生嵌入在 ChatGPT 中。具体来说,比起其他图像生成模型,GPT-4o 能处理多达 10-20 个不同物体的复杂指令。
GPT-4o 图像生成功能可精准文本渲染、严格遵循指令提示、深度调用 4o 知识库及对话上下文 —— 包括对上传图像进行二次创作或将其转化为视觉灵感。

下面是 OpenAI 的官方示例,提示词大意是:用手机拍摄的玻璃白板的广角图像,位于俯瞰海湾大桥的房间里。视野显示一名女性正在写作,她穿着一件带有大型 OpenAI 标志的 T 恤。笔迹看起来很自然,有点凌乱,还看到了摄影师的倒影(另外还指定了白板上的文字)

(责任编辑:IT)
OpenAI 宣布为 ChatGPT 推出图像生成功能:“将迄今最先进的图像生成器集成至 GPT-4o”,这是最近几年 ChatGPT 在图片处理能力方向的一次重要升级。 亮点如下:
即日起,所有 Plus、Pro、Team 及免费用户将陆续在 ChatGPT 和 Sora 中体验该功能,企业版与教育版即将接入,Sora 平台同步启用。开发者即将通过 API 调用 GPT-4o 图像生成功能,接口权限将于未来数周内开放。
值得关注的是,GPT-4o 图像生成是一个自回归模型,原生嵌入在 ChatGPT 中。具体来说,比起其他图像生成模型,GPT-4o 能处理多达 10-20 个不同物体的复杂指令。 GPT-4o 图像生成功能可精准文本渲染、严格遵循指令提示、深度调用 4o 知识库及对话上下文 —— 包括对上传图像进行二次创作或将其转化为视觉灵感。
下面是 OpenAI 的官方示例,提示词大意是:用手机拍摄的玻璃白板的广角图像,位于俯瞰海湾大桥的房间里。视野显示一名女性正在写作,她穿着一件带有大型 OpenAI 标志的 T 恤。笔迹看起来很自然,有点凌乱,还看到了摄影师的倒影(另外还指定了白板上的文字)
|