融合图像分割与风格迁移的文物数字拓片技术探索

吴广; 王云香; 刘礼; 杨平恒

doi:10.13718/j.cnki.xdzk.2025.06.020

融合图像分割与风格迁移的文物数字拓片技术探索

1.
重庆市文物考古研究院，重庆 400013

2.
重庆大学大数据与软件学院，重庆 401331

3.
西南大学地理科学学院，重庆 400715

基金项目: 重庆市科技局绩效激励引导专项课题(cstc2022jxjl00022)；教育部人文社会科学研究规划基金项目(23YJA780003)

详细信息

作者简介:
吴广，博士研究生，副研究馆员，主要从事文物考古数字化等方面的研究 .

中图分类号: K877.4;TP391.41

Digital Rubbing Technology for Cultural Relics: Integrating Image Segmentation and Style Transfer

1.
Chongqing Cultural Relics and Archaeology Research Institute, Chongqing 400013, China

2.
School of Big Data & Software Engineering, Chongqing University, Chongqing 401331, China

3.
School of Geographic Sciences, Southwest University, Chongqing 400715, China

摘要:
随着文化遗产数字化需求的不断增长，传统手工拓片技术因存在潜在风险、操作复杂以及保存不便等问题，已难以满足现代文物保护与展示的高标准要求。全新数字拓片技术凭借其高效、安全的特性，在文化遗产保护领域展现出显著的应用价值，为文物信息的数字化呈现提供了全新路径。为提升数字拓片的生成质量与效率，提出了一种基于图像分割与风格迁移的创新方法。该方法通过结合Segment Anything Model(SAM)的精准图像分割技术和基于深度学习的文物数字拓片风格迁移网络，实现了文物内容与拓片风格的高度融合。具体而言，SAM模型凭借其强大的泛化能力和Prompt-based交互式分割能力，能够快速准确地分割出文物图像中的目标对象。在文物数字拓片风格迁移方面，采用基于深度学习的卷积神经网络(CNN)架构，通过训练神经网络学习特定拓片风格的特征，将这些特征应用到目标图像上，从而生成具有类似风格的数字拓片图像。技术架构采用编码器-解码器设计，并引入拓片风格注意力模块，同时利用细节保留损失函数优化模型训练，确保生成的数字拓片既能保留文物的细节特征，又能精准再现传统拓片的风格特质。实验结果表明，该技术显著提高了自动化水平，能够快速生成高质量的数字拓片。与传统图像处理和三维重构技术相比，该方法无接触式操作避免了对文物的物理损害，同时在细节保留和风格一致性方面取得良好平衡，具有大规模应用的潜力，并降低了总体成本。
- 数字拓片技术 /
- 文化遗产保护 /
- 图像分割 /
- 风格迁移
Abstract:
In the face of the burgeoning demand for the digitalization of cultural heritage, traditional manual rubbing technique has become increasingly inadequate in meeting the high standard requirement of contemporary cultural heritage protection and exhibition. This is attributable to its inherent risks, intricate operational procedures, and challenges in preservation. The novel digital rubbing technology, characterized by its efficiency and safety, has manifested remarkable application value within the realm of cultural heritage protection, thereby charting a new course for the digital representation of cultural heritage information. To enhance the quality and efficiency of digital rubbing generation, this paper proposes an innovative approach grounded on image segmentation and style transfer. This method achieved a high degree of integration between cultural heritage content and rubbing style by integrating the precise image segmentation capabilities of the Segment Anything Model (SAM) with a deep learning based style transfer network for digital cultural heritage rubbings. Specifically, the SAM model, leveraging its robust generalization ability and Prompt-based interactive segmentation prowess, is capable of swiftly and accurately segmenting the target objects within cultural heritage images. In the domain of style transfer for digital cultural heritage rubbings, a convolutional neural network (CNN) architecture founded on deep learning is employed. Through training the neural network to learn the distinctive features of specific rubbing styles and applying these features to target images, digital rubbing images with analogous styles are generated. The technical architecture incorporates an encoder-decoder design and a rubbing style attention module, and utilizes a detail preservation loss function to optimize model training. This ensures that the generated digital rubbings not only preserve the intricate details of cultural relics but also faithfully reproduce the stylistic characteristics of traditional rubbings. Experimental outcomes demonstrate that this technology significantly elevated the level of automation and is capable of rapidly producing high quality digital rubbings. When compared with traditional image processing and 3D reconstruction techniques, this non-contact method obviates the risk of physical damage to cultural relics. Moreover, it strikes a favorable balance between detail retention and style consistency, exhibits potential for large scale implementation, and reduces overall costs. This technology thus offers an efficient and innovative solution for the digital protection and dissemination of cultural heritage.
- digital rubbing technology /
- cultural heritage preservation /
- image segmentation /
- style transfer .

图 1 野外文物手工拓片

下载: 全尺寸图片幻灯片

图 2 SAM架构

下载: 全尺寸图片幻灯片

图 3 文物数字拓片风格迁移网络框架图

下载: 全尺寸图片幻灯片

图 4 内容与风格损失

下载: 全尺寸图片幻灯片

图 5 数字拓片生成系统截图

下载: 全尺寸图片幻灯片

图 6 实验结果

下载: 全尺寸图片幻灯片

表 1 验证集评估结果

指标	1组	2组	3组	4组	5组	6组	7组	8组	9组	10组
SSIM	0.74	0.76	0.73	0.77	0.75	0.78	0.72	0.82	0.74	0.75
PSNR	27.8	28.2	27.9	28.3	28.1	28.4	27.8	29.3	28.0	28.1

下载: 导出CSV

[1]	张文艳. 墓志拓片文物保护路径[J]. 文物鉴定与鉴赏, 2024(18): 32-35.
[2]	朱晓丽, 张春新, 吴中福. "数字拓片"构想及实验研究[J]. 同济大学学报(社会科学版), 2011, 22(3): 82-88.
[3]	RONNEBERGER O, FISCHER P, BROX T. U-Net: Convolutional Networks for Biomedical Image Segmentation [C] //Medical Image Computing and Computer-Assisted Intervention-MICCAI 2015. Cham: Springer International Publishing, 2015: 234-241.
[4]	CHEN L C, PAPANDREOU G, KOKKINOS I, et al. DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFS [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(4): 834-848. doi: 10.1109/TPAMI.2017.2699184
[5]	KIRILLOV A, MINTUN E, RAVI N, et al. Segment Anything [EB/OL]. (2023-04-05) [2024-11-26]. https://arxiv.org/abs/2304.02643v1.
[6]	GATYS L A, ECKER A S, BETHGE M. Image Style Transfer Using Convolutional Neural Networks [C] //2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE, 2016: 2414-2423.
[7]	HUANG X, BELONGIE S. Arbitrary Style Transfer in Real-Time with Adaptive Instance Normalization [C] //2017 IEEE International Conference on Computer Vision (ICCV). New York: IEEE, 2017: 1510-1519.
[8]	ZHANG H, GOODFELLOW I, METAXAS D, et al. Self-Attention Generative Adversarial Networks [C] //Proceedings of the 36th International Conference on Machine Learning (ICML). Long Beach: PMLR, 2019: 7354-7363.
[9]	王书敏. 基于纹理特征方法的甲骨拓片文字定位研究[J]. 信息系统工程, 2020(12): 141-142.
[10]	信泰琦, 席艳峰, 李子豪. 基于多尺度积分不变量的碑刻数字拓片制作研究[J]. 工程勘察, 2024, 52(8): 76-81.
[11]	刘清珺, 刘晓晖, 刘海伦, 等. 探索自动化数字拓印技术对刻文的保护及传承[M]. 北京联合大学, 北京数字科普协会. 互联网时代的数字博物馆. 北京: 电子工业出版社, 2018: 104-110.
[12]	朱晓丽, 吴中福. 基于photoshop实现浮雕图像"数字拓片" 的技术研究[J]. 计算机科学, 2008, 35(12): 224-228.
[13]	朱晓丽, 吴中福, 李颖. 基于MATLAB实现石刻浮雕图像"数字拓片" 技术的研究[J]. 计算机科学, 2009, 36(2): 268-270.
[14]	张园林. 基于三维模型的碑刻数字拓片生成技术及应用[D]. 杭州: 浙江大学, 2018.
[15]	胡春梅, 薛惠敏, 夏国芳, 等. 基于激光点云和近景影像的数字拓片生成方法. 激光杂志, 2017, 38(9): 32-37.
[16]	聂凡. 墓志数字拓片制作与虚拟展示—以周懿王及夫人墓志为例[J]. 大众考古, 2023, (7): 48-53.
[17]	SIMONYAN K, ZISSERMAN A. Very Deep Convolutional Networks for Large-Scale Image Recognition [J] [EB/OL]. (2025-08-10) [2024-08-11]. https://arxiv.org/abs/1409.1556.
[18]	DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An Image Is Worth 16x16 Words: Transformers for Image Recognition at Scale [EB/OL]. (2021-05-03) [2024-08-11]. https://arxiv.org/pdf/2010.11929.
[19]	ZHANG Y C, SHEN Z R, JIAO R S. Segment anything Model for Medical Image Segmentation: Current Applications and Future Directions [J]. Computers in Biology and Medicine, 2024, 171: 108238.
[20]	PARK D Y, LEE K H. Arbitrary Style Transfer with Style-Attentional Networks [C] //2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE, 2019: 5873-5881.

图( 6) 表( 1)

计量

文章访问数: 245
HTML全文浏览数: 245
PDF下载数: 21
施引文献: 0

全文HTML

开放科学（资源服务）标识码（OSID）：
拓片堪称中国传统捶拓技艺的精髓，它能够把碑刻、墓碣、摩崖石刻以及器物上的文字与图案非常精准地复制到宣纸之上，进而变成可以反映不同时代社会文化、政治、经济、宗教以及艺术等诸多方面信息的一种重要的文献载体^[1]。拓片一方面蕴含着卓越的工艺美学价值，另一方面在历史学、考古学、书法研究等诸多领域占据着不可替代的地位。然而，传统手工拓片方法在实际应用中存在不足，比如对文物本体有可能会造成潜在的损害，对操作者自身的技艺水平有着很高的要求，而且对操作环境也有着颇为严格的要求(图 1)。除此之外，拓片的保存以及传播同样面临着重重困难，如采用折叠保存或者卷轴装裱的方式就会致使材料出现脆裂或者损坏的情况，所使用的黏合剂也容易使得纸张出现受潮、氧化以及霉变等问题，拓片遭受虫害以及人为损坏的风险也比较大，在使用以及展示的时候也有很多不便^[2]。数字拓片技术能够很好解决上述问题。

图像分割属于计算机视觉领域里的一项基础技术，其作用在于能够把图像分割成为语义清晰明确的各个区域，进而为后续目标对象的提取以及相关处理工作打下基础。近些年，借助深度学习方法，使得分割工作在精度以及效率这两方面都有了颇为明显的提升^[3-4]。而Segment Anything Model(SAM)作为当下最新的一项技术，凭借其自身通用性以及交互式优化能力，从众多技术当中脱颖而出，尤其适用于复杂图像特征分割处理，如此一来，能够在很大程度上减少人工方面的干预，并且还能有效提升工作的效率^[5]。

近年来，风格迁移技术在图像生成与艺术风格转换领域取得显著进展，其核心突破在于通过神经网络实现内容与风格的分离与融合。文献[6]提出的基于卷积神经网络的风格迁移方法，为该领域的发展奠定了理论基础，而Adaptive Instance Normalization(AdaIN)则是在此基础上进一步达成了实时风格迁移的效果^[7]。最新出现的自注意力生成对抗网络(SAGAN)，将自注意力机制引入传统生成对抗网络，显著提升了生成图像的细节质量与风格表现力，使模型在生成过程中能够更好地捕捉全局上下文信息，生成更加逼真、细腻且风格多样的图像^[8]。

文物数字拓片要求既要完好保留文物图像自身的纹理细节，又要再现传统拓片的风格，这无疑给风格迁移模型设定了更高层级的要求，也是本文围绕风格注意力模块展开深入探究的核心出发点。

本文对图像分割技术以及风格迁移技术加以分析，提出一种将图像分割和风格迁移相结合的创新方法，在提升文物数字拓片生成质量的同时提高生成效率，进而为文物保护、数字化留存及文化传播提供全新方案。

1. 数字拓片的相关概念

1.1. 数字拓片与拓片数字化

数字拓片侧重于通过数字化手段再现文物的物理特征，拓片数字化则是将传统拓片转化为数字资产，二者在技术路径与应用目标上存在本质区别。在文物保护数字化领域，“数字拓片”具体指借助计算机图像处理技术，对文物(如石刻等)的数字影像进行处理，生成具有传统拓片视觉特征的数字图像^[9]。该方法通过数字技术重现传统拓片的外观与细节，其核心在于直接从文物本体获取数字影像，而非传统纸质拓片。

“拓片数字化”就是把已存在的传统纸质拓片，借助影像扫描或摄影等手段，将其转变为数字格式。在此基础上，还要对这些转化后的数据展开存储、管理以及处理等相关操作。如此一来，便能达成传统拓片数字化保存并利用的目的。此过程实际上就是对传统拓片这一物理载体进行数字记录。

虽说两者均牵涉到数字化技术的运用，可它们的核心差异体现在目标以及对象方面：“数字拓片”着重于凭借数字手段通过文物图像生成具有传统拓片视觉效果的数字图像；而“拓片数字化”则是把已有的纸质拓片转变成利于存储和管理的数字格式。

1.2. 数字拓片技术概况

与传统拓片相比，数字拓片技术的数据采集、处理与输出过程具有高效且不受现场环境限制的特点，生成图像的质量与精度具有较高可控性，工艺适用性广泛，并支持二维矢量纹理转换^[10]。此外，数字拓片生成的图像效果更加清晰逼真，纹饰与字体的线刻细节更为丰富，立体感也更加突出。

目前，数字拓片生成技术主要分为两大类。一类基于图像处理技术，通过高分辨率摄影或扫描获取浮雕文物的图像数据，再利用计算机视觉与图像处理算法生成具有传统拓片效果的数字图像。这类方法侧重于二维信息的提取与处理，适用于纹理复杂、表面反光较强的文物，其优势在于操作简便、成本较低，且能够快速生成高质量的数字拓片。另一类采用三维扫描与重构技术，这类方法能够捕捉文物的微小形态特征，保留丰富的空间信息，尤其适用于形态复杂的立体文物。通过获取文物表面的三维形态数据，进行高精度重建与纹理映射，从而实现数字拓片的高保真再现^[11]。

图像技术在数字拓片处理中的应用主要涉及文物的图像采集与后期处理。首先，通过高分辨率摄影或摄像技术获取文物的图像数据。随后，对采集到的刻文图片进行一系列精细化处理，包括图片倾斜校正、背景纹理处理、字符的自动或手工校正与分割、风格化处理以及按实际尺寸进行比例缩放等。这些处理旨在确保生成的数字拓片在细节呈现上达到高保真标准，从而为文化遗产的数字化保护与研究提供高质量的图像资料。早期文物图像处理多依赖Photoshop等图像编辑软件，然而，这一过程需要大量人工操作，效率较低^[12]。为提升自动化水平，文献[13]通过MATLAB编程实现局部阈值分割与均值滤波，初步实现了数字拓片的自动生成，但该方法仍需人工干预，自动化程度有限。此外，此类方法对图像质量要求较高，光照不均匀和噪声干扰易导致处理效果不稳定。文献[14]提出了一种基于三维模型的碑刻数字拓片生成技术。通过对碑刻三维模型的特征进行分析，研究了基于顶点深度和法向量的数字拓片生成方法，并提出了基于深度图的优化方案，有效提升了生成质量。然而，当碑刻表面风化严重时，平面拟合生成的投影面可能出现偏差，导致该方法失效。此外，仅依赖顶点深度生成的深度图，可能无法有效解决因顶点法向量导致的边缘锯齿问题。尽管已有多种类似方法，但这些方法通常对图像拍摄的环境、分辨率和光照条件要求较高，且自动化程度有限。

基于三维扫描及重构技术的数字拓片方法利用非接触式扫描仪对文物的空间外形、结构及色彩进行数字化采集，获取其表面点的三维坐标值，即点云信息。将扫描得到的点云数据输入相关数据处理软件，经过预处理和三维重建，在虚拟空间中创建文物的三维模型。这种方法通过三维激光扫描设备或基于碑刻图像进行三维重建的碑刻三角网格生成数字拓片。例如，文献[15]提出了一种基于激光点云和近景影像的数字拓片生成方法，该方法通过点云和影像配准生成正射影像，并采用图像增强、局部自适应阈值二值化和图像融合技术，生成具有传统拓片效果的数字拓片。然而，对于大规模碑刻，该方法可能难以保持精度，并且需要人工选择特征点进行配准，可能引入人为误差，效率也较低。文献[16]使用高精度三维扫描设备获取墓志的三维空间信息，转换成三角网格模型后，手工选点勾勒碑刻形状，并利用图像处理技术填充三角面片，最终生成具有传统拓片视觉特征的数字图像。此方法依赖于高采样率、高分辨率和高精度的三维扫描设备，但生成的数据量庞大，需专业处理才能恢复文物原貌。此外，将三维数据映射到二维平面以制作刻文数字拓片，仍需进一步探索相关技术。

5. 结论

将图像分割技术和风格迁移技术融合起来，为文物数字拓片自动生成提供了一套全新的解决方案。运用SAM进行图像分割，再与深度学习风格迁移网络结合，成功地将文物内容与拓片风格有效地融合在一起，生成了接近手工拓片风格的文物数字拓片图像。这一技术一方面提升了文物数字拓片处理时的效率以及效果，另一方面也为多样化的文化表达以及传播形式创造了可能性。凭借实现文物信息的数字化以及可视化，推动了文化遗产的保护与利用，也为学术研究、公众教育以及文化交流等诸多方面的应用开拓了新的空间。

虽然本研究的方法在大多数情况下表现优异，但仍存在一些局限。

1) 关于细节丢失问题。处理纹理较为复杂或者表面损坏程度较为严重的文物图像，模型所生成的拓片图像没有办法把所有的细节都完整地还原出来，尤其是针对深浮雕文物图像，呈现出一定的局限性，出现细节丢失。未来的研究可以通过增强模型的特征提取能力和优化算法来进一步提升细节保留效果，以更好地满足文化遗产保护的高标准需求。

2) 拓片风格泛化问题。针对非典型或风格极为独特的拓片样式时，模型的PSNR评分会出现下降。具体而言，在处理复杂拓片风格时，生成图像的细节边缘和视觉效果与原始拓片相比存在较为明显的偏差，未能精准匹配原始拓片的独特风格特征。后续开展的研究工作，将引入更多拓片风格数据集开展训练，让模型学习更广泛的拓片风格特征以提升其泛化能力。

参考文献 (20)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

融合图像分割与风格迁移的文物数字拓片技术探索

1.
重庆市文物考古研究院，重庆 400013

2.
重庆大学大数据与软件学院，重庆 401331

3.
西南大学地理科学学院，重庆 400715

作者简介:
吴广，博士研究生，副研究馆员，主要从事文物考古数字化等方面的研究 .

Digital Rubbing Technology for Cultural Relics: Integrating Image Segmentation and Style Transfer

1.
Chongqing Cultural Relics and Archaeology Research Institute, Chongqing 400013, China

2.
School of Big Data & Software Engineering, Chongqing University, Chongqing 401331, China

3.
School of Geographic Sciences, Southwest University, Chongqing 400715, China

计量

融合图像分割与风格迁移的文物数字拓片技术探索

作者简介: 吴广，博士研究生，副研究馆员，主要从事文物考古数字化等方面的研究
1. 重庆市文物考古研究院，重庆 400013

2. 重庆大学大数据与软件学院，重庆 401331

3. 西南大学地理科学学院，重庆 400715

English Abstract