ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

OpenAI 在 DeepSeek 24 小时前发布 V3 模型 0324 版本更新后,似乎不甘示弱地选择了在北京时间 3 月 26 日凌晨宣布新产品的发布预告。尽管此前有传言猜测本次可能发布 GPT-5,但根据 OpenAI 以往的产品发布节奏,这次并非重磅更新。然而,直播中发布的整合进 ChatGPT 的新版 Sora,却带来了意料之外的惊喜。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

新版 Sora 在图像生成方面的能力暂时局限于独立应用版本,但据 OpenAI 直播介绍,该模型相比以往有了质的飞跃。开发团队以 GPT-4o 的「全模态」能力为基础,开发出这个版本的 Sora。用户可以直接输入需求,甚至上传或拍摄照片作为提示词使用。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

例如,直播现场演示环节中,直接用手机为 Sam Altman 及其他两人拍摄自拍,并要求 Sora 生成一张「动漫风格」的版本。更令人惊喜的是,三人还现场演示了让 Sora 在图片上添加文本「Feel The AGI」(感受通用人工智能),并成功绘制出第一张新版 Sora 的表情包。这张表情包不仅文本准确清晰,还精准理解了当代流行梗图中的粗体字等必备元素,可直接用于社交群组。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

OpenAI 官方带头整活,评论区不少用户也受激发热情,尝试用相同提示词和照片在 Grok 上生成内容,但效果显然不及新版 Sora,反而带来了更多喜感。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

除了画梗图,OpenAI 还展示了新版本 Sora 在文本渲染方面的改进,显著提升了在图像上生成无拼写错误连贯文本的成功率。在另一个演示场景中,OpenAI 团队让 Sora 生成一幅用于理解相对论的漫画卡片。不同于以往生图模型中常见的文本混乱或「AI 造字」现象,新版 Sora 生成的文本清晰无乱,甚至在漫画中自然流畅地生成了日文,意外引爆了日文社区的讨论。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

对于图片生成模型而言,正确渲染文本曾是一个巨大挑战。若小标题或文本元素出现拼写错误,整个图像可能无法使用。此外,OpenAI 还演示了新版 Sora 对「世界上现有知识」的正确引用。ChatGPT 多模态产品负责人 Jackie Shannon 在接受采访时解释,该模型将世界知识代入其中,因此用户只需要求生成牛顿棱镜实验的图像,无需解释实验本身,即可得到准确图像。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

除了上述改进,OpenAI 还表示新版 Sora 大幅提升了在属性和对象之间保持正确关系的能力。例如,绑定能力较差的模型可能将「蓝色星星和红色三角形」的提示词生成红色星星而缺少三角形。新版 Sora 则能正确绑定 15 到 20 个对象的属性,在理解复杂需求的同时避免误导,大幅提高成功率。

ChatGPT新Sora模型发布:生图能力大幅提升抢了梗图作者饭碗

尽管新版 Sora 生成图像的时间比以往更长,但 OpenAI 认为这是一个值得的权衡。Shannon 表示,虽然延迟方面仍有改进空间,但生成图片的质量、功能和世界知识确实弥补了用户等待的额外几秒钟。

在生图领域的安全问题方面,OpenAI 团队强调新版 Sora 已能去除照片水印,阻止生成性深度伪造图像,并拒绝生成相关内容请求。所有生成的图像都将包含标准的 C2PA 元数据,标记图像由 OpenAI 创建。

目前,新版集成在 ChatGPT 内的 Sora 图像生成模型功能已开放给 Pro 和 Plus 订阅套餐用户,OpenAI 承诺未来也会提供给免费版本和 API。现在最想做的,就是立即让 Sora 帮我画一张自己的梗图。

欢迎加入深潮 TechFlow 官方社群 Telegram 订阅群:http://www.idea2003.cn/TechFlowDaily Twitter 官方账号:http://www.idea2003.cn/TechFlowPost Twitter 英文账号:http://www.idea2003.cn/DeFlow_Intern

本文网址:http://www.idea2003.cn/news/2304.html

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注