(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210266952.2
(22)申请日 2022.03.17
(65)同一申请的已公布的文献号
申请公布号 CN 114783072 A
(43)申请公布日 2022.07.22
(73)专利权人 哈尔滨工业大 学 (威海)
地址 264333 山东省威海市文化西路2号
专利权人 南京龙垣信息科技有限公司
(72)发明人 丁建睿 汤丰赫 张星东 丁卓
(74)专利代理 机构 苏州中合知识产权代理事务
所(普通合伙) 32266
专利代理师 阮梅
(51)Int.Cl.
G06V 40/70(2022.01)
G06V 10/40(2022.01)
G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06V 10/80(2022.01)(56)对比文件
CN 113627433 A,2021.1 1.09
CN 109583 506 A,2019.04.0 5
CN 10975 3566 A,2019.0 5.14
CN 111223553 A,2020.0 6.02
CN 111738315 A,2020.10.02
CN 110427875 A,2019.1 1.08
CN 109583482 A,2019.04.0 5
CN 110458043 A,2019.1 1.15
US 2020327962 A1,2020.10.15
US 2021390 355 A1,2021.12.16
WO 2022002943 A1,202 2.01.06
黄剑华 等. “基于局部加权的Citati on-kNN
算法”. 《电子与信息学报》 .2013,第3 5卷(第03
期),627- 632. (续)
审查员 张楠霞
(54)发明名称
一种基于远域迁移学习的图像识别方法
(57)摘要
本发明公开一种基于远域迁移学习的图像
识别方法, 包括如下步骤: 将医学领域的小样本
图像作为目标域, 同时将与目标域相似度高的无
标签图像作为辅助域, 将自然场景图像作为源
域, 通过基于Resnet 50的轻量级网络提取各自域
的高级语义特征; 利用具有域距离度量的卷积自
动编码器并通过辅助域作为桥梁对源域和目标
域的高级语义特征进行特征融合; 通过卷积自动
解码器重构各自域的高级语义特征; 最后通过全
连接层对目标域图像进行识别, 整个过程通过多
任务损失函数进行优化。 本发明改善了模型对高
级语义信息的提取能力和稳定性, 有效提升了模
型远域特征迁移能力, 本发明可以用于不同任务
的图像识别任务。
[转续页]
权利要求书2页 说明书6页 附图3页
CN 114783072 B
2022.12.30
CN 114783072 B
(56)对比文件
Shuteng N iu 等.“Distant Domai n
Transfer Learn ing for Medical Ima ging”.
《IEEE Journal of Bi omedical and Health
Informatics 》 .2021,第25卷(第10期),3784 –
3793.
S. J. Pan 等.“A Survey o n Transfer
Learning”. 《 IEEE Transacti ons on
Knowledge and Data Engi neering》 .2010,第2 2
卷(第10期),1345 -1359.
Grubinger, T 等. “ Multi-Domai n
Transfer Compo nent Analy sis for Domai n Generalization”. 《 Neural Proces s Lett》
.2017,(第46期),845 –855.
Tan B 等. “Distant domai n transfer
learning”. 《 AAAI Conference o n Artificial
Intelligence》 .2017,第 31卷(第1期),26 04-
2610.
黎英.“迁移学习在医学图像分析中的应用
研究综述 ”. 《计算机 工程与应用》 .2021,第57 卷
(第20期),42- 52.
Maithra Ra ghu等.“Transfusi on:
Understandi ng transfer learn ing for
medical ima ging”. 《 Computer Visi on and
Pattern Recogn ition》 .2019,1-2 2.2/2 页
2[接上页]
CN 114783072 B1.一种基于远域迁移学习的图像识别方法, 其特 征在于, 包括如下步骤:
步骤S1, 将医学领域的小样本图像作为目标域, 同时将与目标域的领域相似度高的无
标签图像作为辅助域, 自然场景图像作为源域;
步骤S2、 将源域、 辅助域和目标域的数据集输入到Resnet50 layer1、 Resnet50 layer2
和Resnet50 layer3组成的轻量级特征提取网络, 在加载Imagenet数据集的预训练权重到
网络中后使用网络分别提取表示源域、 辅助域和目标域的高级语义特 征;
步骤S3、 将属于源域、 辅助域和目标域的高级语义特征通过具有域距离度量的高级语
义特征卷积自动编 码器并通过辅助域作为桥梁最小化源域与辅助域、 目标域与辅助域的域
损失以进行高级语义特 征融合;
步骤S4、 利用卷积自动解码器重构融合后的高级语义特征, 最小化内容损失以保持源
域、 辅助域和目标域特 征的多样性和完整性;
步骤S5、 使用全连接层对卷积自动解码器提取的目标域高级语义特 征进行分类;
步骤S6、 在多任务优化函数下对算法模型的参数进行调整, 直到达到迭代次数或者精
度需求。
2.根据权利要求1所述的一种基于远域迁移学习的图像识别方法, 其特征在于, 所述源
域、 辅助域和目标域的数据集满足如下假设成立: pS(x)≠pT(x) ,pT(x)≠pA(x) ,
其中pS(x)和pA(x)分别为源域和辅助域的条件分布,
pT(x)和pT(x)|x)分别是目标域的条件分布和边 缘分布。
3.根据权利要求1所述的一种基于远域迁移学习的图像识别方法, 其特征在于, 所述卷
积自动编码器包括两个池化层和两个卷积层, 卷积层 使用pad为1、 stride为1的3x3卷积核,
编码器的第一个卷积层的卷积核 数量为1024, 第二个卷积层卷积核数量为2048, 使用2x2的
最大池化进行下采样; 所述卷积自动解码器由两个卷积层和两个上采样层组成, 解码器的
第一个卷积层的卷积核数量为1024, 第二个卷积层卷积核 数量为1024, 采用2x2上采样以重
建出相同大小的高级语义特 征, 解码和编码的标准过程表示 为:
其中f是Resnet50轻量级特征提取网络输出的高级语义特征, fabstract是f经过编码器后
的更高层次的抽象特 征,
是重构后的高级语义特 征。
4.根据权利要求3所述的一种基于远域迁移学习的图像识别方法, 其特征在于, 所述步
骤S3, 具体包括如下步骤:
最小化源域到目标域距离的衡量采用最大平均差异MMD, 最大平均差异MMD计算公式如
下:
其中s和t代表源域和目标域,
表示将原始数据映射到希尔伯特空间RKHS的核函数,
MMD的经验 估计定义 为:
权 利 要 求 书 1/2 页
2
CN 114783072 B
3
专利 一种基于远域迁移学习的图像识别方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:17:55上传分享