Research and Application of a Deep Learning-Based Automated 3D Modeling Algorithm for Hand-Drawn Sketches

WANG Wei; ZHENG Dandan

doi:10.13718/j.cnki.xdzk.2025.05.021

2025 Volume 47 Issue 5

Article Contents

Previous Article Next Article

WANG Wei, ZHENG Dandan. Research and Application of a Deep Learning-Based Automated 3D Modeling Algorithm for Hand-Drawn Sketches[J]. Journal of Southwest University Natural Science Edition, 2025, 47(5): 242-252. doi: 10.13718/j.cnki.xdzk.2025.05.021

Citation:

WANG Wei, ZHENG Dandan. Research and Application of a Deep Learning-Based Automated 3D Modeling Algorithm for Hand-Drawn Sketches[J]. Journal of Southwest University Natural Science Edition, 2025, 47(5): 242-252. doi: 10.13718/j.cnki.xdzk.2025.05.021

Research and Application of a Deep Learning-Based Automated 3D Modeling Algorithm for Hand-Drawn Sketches

WANG Wei¹,
ZHENG Dandan²

1.
School of Art & Design, Wuhan Technology and Business University, Wuhan 430065, China
2.
School of Arts and Communication, China University of Geosciences (Wuhan), Wuhan 430074, China

More Information

Received Date: 18/03/2024
Available Online: 20/05/2025
MSC: TP391

Abstract

Compared to image-based modeling approaches, sketch-based 3D model design provides users with a more intuitive way to realize their design visions captured in hand-drawn sketches. However, due to the typically sparse and ambiguous nature of hand-drawn sketches, accurately creating 3D shape designs from them poses a challenging task. To address this challenge, this study proposed a deep learning-based automation algorithm for the three-dimensional modeling of hand-drawn sketches, and applied it specifically to the design of automotive models. The system maximizes the utilization of user-provided hand-drawn sketch inputs by employing deep learning techniques to estimate the unsigned distance field (UDF) of the target 3D model. Utilizing the Marching Cubes algorithm, the system intelligently extracts the grid of the automotive model from the estimated UDF field. To enhance user customization flexibility, model editing functionality is introduced, allowing users to make flexible modifications to the generated grid. Through quantitative evaluations of automotive model generation and editing, comparisons with current state-of-the-art methods, the system's significant advantages in producing high-quality automotive models is revealed. The system successfully generated diverse types of automotive models using only a single sketch input. These models exhibited intricate local features. In comparison to other machine learning structures, this approach demonstrates superior performance levels. This research contributes innovative perspectives and powerful tools for intelligently handling hand-drawn sketches, emphasizing the crucial role of deep learning in three-dimensional modeling of hand-drawn sketches.
- hand-drawn sketches,
- 3D modeling,
- 3D car models,
- deep learning,
- automation

References

[1]	李雄, 苏建宁, 张志鹏. 基于深度学习的产品概念草图生成设计研究[J]. 机械工程学报, 2023, 59(11): 16-30. Google Scholar
[2]	孟志刚, 廖帅元. 基于深度学习的手绘图形识别的研究[J]. 计算机与数字工程, 2023, 51(4): 949-953. Google Scholar
[3]	李洋, 康文惠, 黄进, 等. 基于笔式交互的人机混合CAD概念设计[J]. 计算机集成制造系统, 2022, 28(7): 2050-2063. Google Scholar
[4]	李萌, 查思雨, 宫未, 等. 面向儿童学习的智能家居人机交互技术综述[J]. 计算机辅助设计与图形学学报, 2023, 35(2): 248-261. Google Scholar
[5]	周荣庭, 余悦玫, 李瑾. 科普文创产品的设计与营销策略[J]. 自然科学博物馆研究, 2022, 7(5): 49-55. Google Scholar
[6]	XU P, HOSPEDALES T M, YIN Q, et al. Deep Learning for Free-Hand Sketch: A Survey[J]. IEEE Trans Pattern Anal Mach Intell, 2023, 45(1): 285-312. doi: 10.1109/TPAMI.2022.3148853 CrossRef Google Scholar
[7]	OKURA F. 3D Modeling and Reconstruction of Plants and Trees: A Cross-Cutting Review across Computer Graphics, Vision, and Plant Phenotyping[J]. Breeding Science, 2022, 72(1): 31-47. doi: 10.1270/jsbbs.21074 CrossRef Google Scholar
[8]	BRODT K, BESSMELTSEV M. Sketch2Pose[J]. ACM Transactions on Graphics, 2022, 41(4): 1-15. Google Scholar
[9]	CHEN T R, CAO R L, LI Z J, et al. Deep3DSketch-Im: Rapid High-Fidelity AI 3D Model Generation by Single Freehand Sketches[J]. Frontiers of Information Technology & Electronic Engineering, 2024, 25(1): 149-159. Google Scholar
[10]	CHEN T R, CAO R L, LI Z J, et al. Deep3DSketch-Im: Rapid High-Fidelity AI 3D Model Generation by Single Freehand Sketches[J]. Frontiers of Information Technology & Electronic Engineering, 2024, 25(1): 149-159. Google Scholar
[11]	蔡兴泉, 李治均, 奚梦瑶, 等. 基于神经网络的手绘服饰图纹上色及风格迁移[J]. 系统仿真学报, 2023, 35(3): 604-615. Google Scholar
[12]	LI M Y, CHEN W, WANG S S, et al. Survey on 3D Reconstruction Methods Based on Visual Deep Learning[J]. Journal of Frontiers of Computer Science & Technology, 2023, 17(2): 279. Google Scholar
[13]	蔺琛皓, 沈超, 邓静怡, 等. 虚假数字人脸内容生成与检测技术[J]. 计算机学报, 2023, 46(3): 469-498. Google Scholar
[14]	LI Y X, QIAN J M, FENG S J, et al. Deep-Learning-Enabled Dual-Frequency Composite Fringe Projection Profilometry for Single-Shot Absolute 3D Shape Measurement[J]. Opto-Electronic Advances, 2022, 5(5): 210021. doi: 10.29026/oea.2022.210021 CrossRef Google Scholar
[15]	LIU C, WANG D L, ZHANG H, et al. Using Simulated Training Data of Voxel-Level Generative Models to Improve 3D Neuron Reconstruction[J]. IEEE Transactions on Medical Imaging, 2022, 41(12): 3624-3635. doi: 10.1109/TMI.2022.3191011 CrossRef Google Scholar
[16]	LIU M T, ZHU A H, MAITI P, et al. Style Transfer Generative Adversarial Networks to Harmonize Multisite MRI to a Single Reference Image to Avoid Overcorrection[J]. Human Brain Mapping, 2023, 44(14): 4875-4892. doi: 10.1002/hbm.26422 CrossRef Google Scholar
[17]	MA Z P, ZHOU J, MA J L, et al. A Novel 3D Shape Recognition Method Based on Double-Channel Attention Residual Network[J]. Multimedia Tools and Applications, 2022, 81(22): 32519-32548. Google Scholar
[18]	AYUBI J, AMIRANI M C, VALIZADEH M. A New Seam Carving Method for Image Resizing Based on Entropy Energy and Lyapunov Exponent[J]. Multimedia Tools and Applications, 2023, 82(13): 19417-19440. Google Scholar
[19]	HERTZ A, PEREL O, GIRYES R, et al. Spaghetti[J]. ACM Transactions on Graphics, 2022, 41(4): 1-20. Google Scholar

Access History

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

Figures(9) / Tables(1)

Export Citation

PDF

XML

Article Metrics

Article views(97) PDF downloads(11) Cited by(0)

Access History

Other Articles By Authors

on this site
- WANG Wei
- ZHENG Dandan
on Google Scholar
- WANG Wei
- ZHENG Dandan

HTML

开放科学（资源服务）标识码（OSID）：
手绘草图是一种普遍的交流和艺术方式，它跨越障碍，将人类社会联系在一起，是人类最原始、最直接的表达方式之一，无需特定的工具和技能，只需一支笔、一张纸就能将脑海中的想法和情感生动地呈现出来。在远古时期，我们的祖先就已经开始在洞穴墙壁和陶器上绘制各种图形和符号，用以记录生活、表达情感和传递信息。随着人类社会的发展，手绘草图逐渐演变成为一种重要的沟通工具，被广泛应用于各个领域。无论是科学家、工程师、建筑师，还是艺术家、设计师、教师等都可以通过手绘草图来表达自己的想法和创意。手绘草图具有很强的直观性和表现力，能够将复杂的概念和抽象的想法变得具体而形象。它能够跨越语言和文化障碍，让人们在没有文字的情况下也能够理解和交流。特别是在现代社会，随着全球化的推进，手绘草图作为一种国际语言越来越受到人们的重视。与专业素描、法医素描、漫画、技术绘画和油画等其他相关表现形式不同，手绘草图不需要训练，也不需要特殊设备，因此不受年龄、种族、语言、地域或国界的限制，可以被视为大脑内部对世界的表述，无论是感知的、还是想象的。

自由手绘草图尽管高度简洁和抽象，但却能说明问题，在交流和设计等各种场景中非常有用。因此，手绘草图在计算机视觉和模式识别^[1]、计算机图形学^[2]、人机交互^[3]、机器人学^[4]和认知科学^[5]等领域被广泛研究。其中，早期的研究可追溯到20世纪60、70年代。近年来，基于草图的方法已被应用于内容创作支持的各个领域，例如图像生成^[6]、3D模型重建^[7]和动画控制^[8]。3D汽车模型在娱乐、视觉效果和汽车设计等多个领域被大量使用。由于生成与现实世界相似特征模型的过程通常既耗时又费力，因此从单个图像输入重建3D模型的自动方法可以作为有效的解决方案。

尽管在相关领域进行了大量研究，但由于多种原因，复杂3D汽车模型的高质量重建仍然具有挑战性。在动画、游戏和汽车制造行业，设计过程通常涉及汽车概念图，而概念图通常是在预定义视角上以草图形式表现出来，因此以往使用照片输入的方法在设计新形状或修改现有设计时并不实用。对基于深度学习的方法来讲，不同类型汽车(如SUV和卡车)具有明显不同的特征，使得单一神经网络难以学习复杂的数据分布。汽车建模细节是一个明显的问题，因为汽车既有共同特征，如车轮的位置，也有独特部分，如尾翼和车顶形状。因此，构建一个能够充分表达常见汽车特征和独特汽车特征的多样化汽车子空间是一项挑战。

近年来，触摸屏设备普及使草图创建变得更加便捷，进而推动了面向草图的应用程序流行。同时，深度学习不断进步推动了手绘草图在3D汽车模型设计领域的研究和应用，而基于深度学习的方法成功实现了从单一简单草图生成更简洁、更准确模型的目标。文献[9]尝试通过将模板网格变形为目标形状的方式从草图中生成3D模型，这是一种常见的从单一视角图像还原3D模型的方法；而文献[10]则利用隐式函数学习方法，通过学习符号距离函数(SDF)来生成目标形状。然而，文献[9]可能受到模板模型拓扑结构的限制；而文献[10]则仅限于水密的3D网格设计。

本文的目标是从用户手绘草图中生成非水密的3D汽车模型。为了解决这个问题，采用了无符号距离函数隐式场，通过系统从手绘草图生成3D汽车模型，进而生成非水密网格的汽车3D模型，这是一种在处理非水密网格时具有卓越性能的表示方式。使用无符号距离函数(UDF)能够更加灵活地捕捉和呈现手绘草图中的复杂形状，而无需受限于特定模板的拓扑结构。UDF的引入使得本文系统能够更加自由地生成非水密网格的汽车3D模型，更好地满足用户对手绘草图的设计需求。通过应用UDF，可成功克服文献[9]和文献[10]模型中存在的限制，从而提升本文模型的灵活性和适用性。本文的创新之处在于：

1) 提出了一种新颖的基于草图的3D汽车模型生成系统。相较于基于图像的建模，该方法更注重用户通过手绘草图传达设计意图，使生成的3D模型更加贴合用户需求。

2) 利用深度学习技术估计手绘草图的无符号距离字段(UDF)，并通过Marching Cubes算法从估计的字段中提取模型网格。UDF的使用对复杂形状建模更为灵活，尤其适用于处理非水密网格。

3) 引入了深度学习驱动的自动编码器结构，系统不仅生成汽车模型，还提供了用户友好的编辑功能。用户可以通过编辑生成的网格实现对模型的个性化定制，为创造性和设计灵活性提供了更多的空间。

1. 相关工作

1.1. 基于图像的3D形状建模

基于图像的3D形状建模文献很多，主要可分为单视图和多视图 3D形状建模，现有方法可以根据所使用的3D标识进一步分类。基于体素的模型是研究最广泛的模型，其中卷积神经网络(CNN)已被成功应用于学习给定2D视图图像的3D对象重建的概率潜在空间。然而，这些方法往往受到计算效率限制，经常导致产生的体素数量不满足。为了缓解这种情况，研究人员提出了基于八叉树的网络和点云模型来生成更高分辨率的模型。目前，基于多边形网格的方法由于同时编码了几何(点云)和拓扑(表面连通性)线索，获得了广泛关注。然而，这些方法仍然受到模板形状拓扑限制，难以准确地重建亏格大于0的形状。一些学者已经提出将表面法线和深度图的多个视图作为监督信号来训练3D建模系统。使用额外的融合步骤将其合并到点云中，然后使用预测的轮廓去除异常值。

1.2. 基于草图的3D形状建模

由于两个主要因素，从人体草图估计3D形状比从单个图像估计更具挑战性：①模糊性，即多个3D形状可能投影到同一张图纸上；②失真，即草图和3D形状之间存在错位。早期的研究尝试通过利用几何属性来推断3D形状，即主要通过推断局部几何属性来预测3D形状。手工设计规则通常用于将轮廓拉伸或抬高成光滑的3D表面。同时，一些方法采用多面体脚手架、横截面线和曲率流线等工具来创建自由曲面。这些早期方法试图应对模糊性和失真这两个挑战，从而提高依据人体草图估计3D形状的准确性。

近年来，深度学习方法被用于基于草图的建模任务。蔡兴泉等^[11]建议首先将输入草图转换为深度/法线图，并将其融合构建完整的3D模型。但是，所有这些方法都是基于整体草图执行的，导致缺少对象的细节。Li等^[12]利用深度神经网络从2D草图中预测人脸的潜在代码，生成详细的人脸模型。蔺琛皓等^[13]则训练网络来预测程序模型参数，从草图中生成详细的形状。这些方法可以生成复杂的高分辨率模型，但仅适用于通过编程方式生成的形状。为了处理更复杂的形状，Li等^[14]设计了一个端到端的卷积神经网络，给定输入草图且基于体积的表示形式生成相应的3D形状，但是这种方法仅限于低分辨率3D网格。Liu等^[15]提出了一个基于生成对抗网络(GAN)框架的方法用于生成法线图，并通过结合用户特定法线的交互过程来提高生成结果的质量。但该方法的实现成本相对较高，因为它需要额外的点掩模和用户指南输入。Liu等^[16]采用对抗性训练将合成图像和来自3D形状库的参考3D形状作为源，形成联合特征，尽管取得了令人满意的结果，但该方法严重依赖画廊中的模板形状，在很大程度上限制了其普适性。Ma等^[17]基于图像空间轮廓渲染得到的合成草图进行训练，致力于3D形状建模，通过单视图CNN和更新程序CNN训练，成功地从草图生成了占用体素网格。然而，该方法在重建薄结构方面存在一定的局限性。

4. 总结

在电脑游戏、视觉效果和汽车设计等领域，3D汽车模型得到广泛应用，因此以最低劳动力成本生产这类模型变得越来越重要。为了解决这一问题，本文提出一种新颖系统，可使用单个2D手绘草图重建详细的3D汽车形状，且设计生成的系统利用自动编码器结构学习UDF隐式表示，并输出UDF数据。网格通过行进立方体方法从UDF中提取，同时该系统还允许普通用户绘制草图并编辑生成3D汽车模型。当用户编辑生成模型轮廓时，基于优化潜向量编码器实现模型编辑，并通过评估实验，验证本文系统在从手绘草图生成3D汽车模型方面的有效性。虽然本文方法是产品设计中通用的方法，但为了实现这一目标需要构建更多的通用数据集，包含各种产品类型的配对草图图像和3D模型。该数据集将涵盖家居用品、电子产品、交通工具等多种不同类型的产品，未来将进一步深入探索更多的方向，例如可以利用宜家数据集从草图图像中生成3D家具模型，该数据集包含大量家具设计草图及相应的3D模型，可供训练和测试框架使用。通过使用该数据集，能够提高家具设计领域内的模型准确性和效率，从而进一步推动产品设计发展。除了家具设计外，还可以探索服装设计、工业设计等其他领域的应用。

Figure (9) Table (1) Reference (19)

Name
	Name cannot be empty!
E-mail
	Mailbox cannot be empty! Mailbox cannot be empty!
Telephone
	Mobile number cannot be empty! Please enter a valid mobile number!
Title

Content
Verification Code

Message Board

Research and Application of a Deep Learning-Based Automated 3D Modeling Algorithm for Hand-Drawn Sketches