3D—GPT从文本提示生成3D环境

AI行业新闻1年前 (2023)发布 yundic
102 0 0

在澳大利亚国立大学、牛津大学和北京人工智能研究院的合作下,研究人员推出了一种名为3D-GPT的人工智能系统。

这一系列复杂的人工智能代理能够通过简单的文本提示生成3D环境。

该文件可在 arXiv,展示了简化且用户友好的3D资产创建方法,与传统3D建模所涉及的复杂工作流程形成鲜明对比。

通过简单地描述一个环境,比如“白雪覆盖的山峰,背景是明亮的阳光”,人工智能系统将解释和充实环境的描述,并使用它生成代码,可以传递到3D计算机图形软件,如Blender。

3D—GPT将复杂的3D建模任务分解为可管理的部分,并将每个部分委托给专门的AI代理。

代理的角色如下:

  1. 任务调度代理:解释用户提供的文本说明。
  2. 概念化代理人:通过填写任何缺失的细节来丰富最初的描述。
  3. 建模代理:设置必要的参数并生成代码来操作3D软件,如Blender。

使用这种基于代理的结构,3D—GPT可以解释文本提示,使用附加上下文增强描述,并创建与用户想象力紧密一致的3D资产。

3D—GPT从文本提示生成3D环境

3D—GPT用于将文本提示符转换为3D图形的管道。资料来源:ArXiv。

将文本转换成3D世界

文章描述了3D—GPT如何使用简单的文本提示,如“一个薄雾弥漫的春天早晨,露珠亲吻的花朵点缀着郁郁葱葱的草地,周围环绕着萌芽的树木”,并为其注入生命力,创建一个丰富的3D场景与逼真的图形。

虽然这项技术还没有达到照片真实感的阶段,但结果是有希望的。

研究人员对未来持乐观态度,他们表示:“我们的实证研究证实,3D-GPT不仅能解释和执行指令,提供可靠的结果,还能与人类设计师有效合作。”

他们认为,他们的系统“突出了LLM在3D建模中的潜力,为场景生成和动画的未来发展提供了基本框架。

随着虚拟现实等技术的发展,3D-GPT等工具可能变得不可或缺。

潜在的应用程序涵盖了许多行业,包括游戏、虚拟现实、电影和多媒体体验,使3D内容创建更加高效和可访问。

3D—GPT可能会给视频游戏设计师和3D建模师敲响警钟,他们已经受到集成到Unity等流行设计平台的类似工具的攻击。

© 版权声明

相关文章

暂无评论

暂无评论...