据报道,OpenAI正在开发DALL—E 3,这是其文本到图像生成器的升级版本。
根据YouTuber MattVidPro AI的数据,目前约有400人可以访问DALL—E3的私人测试服务器,并且已经有几张其作品的图片泄露。
MattVidPro AI分享的一段视频显示了DALL—E测试版本从5月到7月的进展。
DALL—E的这个进化版本似乎能够生成真实照片图像,并使用特定的技术,如画笔或铅笔绘图。
根据MattVidPro AI的说法,DALL—E的未发布版本还可以生成描绘戈尔、血液和版权内容的图像—他提供了一些涉及士力架酒吧和赛百味的照片示例。
它还擅长制作排版,这是过去和现在文本到图像模型的致命弱点。
DALL—E3的排版技巧。
YouTuber将该工具描述为“非常令人兴奋。它能把我们以前见过的东西都吹出来。太疯狂了。”
他还说:“中途不能在这个水平上竞争。我甚至不认为中途第六版能够在这个水平上竞争。
视频中的评论者强调了中途旅程的能力差,坚持提示,这是DALL—E3应该解决的问题。
他继续说,“你可以做版权保护的艺术品和材料的精确复制。它将完美地完成受版权保护的角色,完美的标志,完全准确地描绘名人,并全面描绘极端暴力”,并继续说,该模型有时会产生不适当的图像,而没有明确的程序这样做。
泄露的DALL—E3照片显示版权内容(地铁三明治)。
马特说:”他们显然有一些微调和一些安全工作要做。”
与其他文本到图像AI的比较
新的Dall-E和MidTrik的最新型号之间的比较显示,OpenAI的内容更优越,对给定提示的遵守更好,图像质量也更好。
不过,DALL—E3升级版仍在开发中,其正式发布日期仍不确定。当然,这段YouTube视频旨在炒作DALL—E3,公开版可能与任何“秘密”测试版大相径庭。
一旦发布,DALL—E3可能会有几个限制,例如涉及血液、血迹、版权内容和艺术品复制品的绝育图像。
DALL—E3是否会让OpenAI重回图像生成AI市场的巅峰?