UniDream: Unifying Diffusion Priors for Relightable Text-to-3D Generation

Liu, Zexiang; Li, Yangguang; Lin, Youtian; Yu, Xin; Peng, Sida; Cao, Yan-Pei; Qi, Xiaojuan; Huang, Xiaoshui; Liang, Ding; Ouyang, Wanli

Computer Science > Computer Vision and Pattern Recognition

arXiv:2312.08754 (cs)

[Submitted on 14 Dec 2023 (v1), last revised 13 Jul 2024 (this version, v2)]

Title:UniDream: Unifying Diffusion Priors for Relightable Text-to-3D Generation

Authors:Zexiang Liu, Yangguang Li, Youtian Lin, Xin Yu, Sida Peng, Yan-Pei Cao, Xiaojuan Qi, Xiaoshui Huang, Ding Liang, Wanli Ouyang

View PDF HTML (experimental)

Abstract:Recent advancements in text-to-3D generation technology have significantly advanced the conversion of textual descriptions into imaginative well-geometrical and finely textured 3D objects. Despite these developments, a prevalent limitation arises from the use of RGB data in diffusion or reconstruction models, which often results in models with inherent lighting and shadows effects that detract from their realism, thereby limiting their usability in applications that demand accurate relighting capabilities. To bridge this gap, we present UniDream, a text-to-3D generation framework by incorporating unified diffusion priors. Our approach consists of three main components: (1) a dual-phase training process to get albedo-normal aligned multi-view diffusion and reconstruction models, (2) a progressive generation procedure for geometry and albedo-textures based on Score Distillation Sample (SDS) using the trained reconstruction and diffusion models, and (3) an innovative application of SDS for finalizing PBR generation while keeping a fixed albedo based on Stable Diffusion model. Extensive evaluations demonstrate that UniDream surpasses existing methods in generating 3D objects with clearer albedo textures, smoother surfaces, enhanced realism, and superior relighting capabilities.

Comments:	Accepted to ECCV 2024
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2312.08754 [cs.CV]
	(or arXiv:2312.08754v2 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2312.08754

Submission history

From: Yangguang Li [view email]
[v1] Thu, 14 Dec 2023 09:07:37 UTC (11,067 KB)
[v2] Sat, 13 Jul 2024 19:09:39 UTC (10,522 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:UniDream: Unifying Diffusion Priors for Relightable Text-to-3D Generation

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:UniDream: Unifying Diffusion Priors for Relightable Text-to-3D Generation

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators