中国是丝绸的发源地,丝绸图案作为丝绸的主要元素承载了深远的历史文化。计算机视觉技术在丝绸图案的检测并不多见,主要因为丝绸图案类别繁多,总体数量不多,一般的目标检测技术无法在丝绸这样的小样本数据集上发挥良好的效果。针对该问题,本文提出了一种适用于小样本丝绸数据集的多尺度注意力目标检测算法,通过多尺度类向量为目标检测网络提供更多的分类信息,实现丝绸图案的检测任务。本文针对古代丝绸中常见图案进行数据收集和数据标定,并且利用提出的网络实现对不同年代的狮子和花卉进行实验。实验结果表明该方法可以实现小样本丝丝绸图案目标检测任务,而且效果优于其他小样本目标检测算法。
丝绸贸易开辟了古代中国与西域国家的贸易之路,使得中国文化得以广泛传播。丝绸是丝绸图案的主要载体,丝绸图案的风格与题材随年代发展不尽相同,深刻的反映了当时的人文风俗。把目标检测技术用于丝绸研究具有十分深远的历史意义。
目前,丝绸研究人员对丝绸图案的年代和类别的研究主要依赖人眼识别,分类结果往往取决于个人经验。使得丝绸图案研究工作效率偏低,研究结果往往富有主观性而且缺乏一致性。计算机视觉技术日益先进,目标检测技术在文物识别方面有了广泛的应用,但是目标检测在丝绸图案上的应用并不多见, 因此对于丝绸目标检测技术的研究十分必要。
主流的目标检测算法可以分为两种类型:1) 基于候选框的两阶段目标检测算法[1] [2] [3];2) 基于anchor 的单阶段目标检测算法[4] [5] [6]。并且经过各种改进这两种算法在PASCAL VOC、MS COCO 等公共数据集上的效果不分伯仲。然而简单得将这两类深度学习算法应用到古代丝绸图案检测上并不能达到理想的效果,其中最主要的原因在于,丝绸数据种类多数量少的特点,经过多轮迭代训练不能得出具有泛化性能的模型。
针对小样本问题,人们希望模型能具有人类的学习能力,只需通过简单的学习就能分辨出不同的事物。学者们纷纷从各个角度提出不同的解决方案。基于微调的迁移学习方法[7],研究认为直接在小样本空间上的模型缺少泛化性,提出迁移学习策略。首先让模型在分布相似的大数据集上进行粗略的学习, 初始化目标域的相关参数,然后固定住底层网络参数,让具有初始化参数的模型在目标域上继续学习目标域独有的特征,但是这种方法会忽略源域和目标域的重要目标知识,降低模型的可传递性[8]。基于度量学习[9] [10] [11]的方法在孪生网络的基础上进行改进,首先基于网络共享提取查询图像和目标图像的特征,然后将该特征作为可学习度量网络的输入,网络输出查询图像和目标图像相似度作为分类结果。
但是基于度量学习的模型只适用于单个目标的输入, 缺乏普适性。
基于元学习的目标检测算法[12]提出将元学习方法应用在传统的目标检测上,通过元学习的策略学习一个具有普适性的目标检测模型,该模型能快速从少量数据中学习数据的分布。
Meta R-CNN [13] [14]等提出基于Faster R-CNN 增加了类注意力机制,类注意模块与Faster R-CNN 共享特征提取层,从Support 集中提取类别信息作为Faster R-CNN 分类器的指导信息,提高模型的准确率。
中国古代丝绸上的图案以有序为美,同样的图案会重复出现, 并且有大小变换。
当Support 集中的图