(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210244332.9
(22)申请日 2022.03.14
(71)申请人 西安电子科技大 学
地址 710071 陕西省西安市太白南路2号
(72)发明人 刘向增 高豪杰 苗启广 宋建锋
纪建
(74)专利代理 机构 西安恒泰知识产权代理事务
所 61216
专利代理师 李郑建
(51)Int.Cl.
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06V 10/46(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于多模式特征的红外与可见光图像
融合方法
(57)摘要
本发明公开了一种基于多模式特征的红外
和可见光图像融合方法, 包括: 1.提取多模式特
征的编码器 ‑解码器网络, 2.使用熵、 梯度和显著
性对多模式特征进行度量并设计自适应loss函
数, 3.构建嵌入Transformer融合策略的融合权
重学习模型, 4.将红外图像的显著性图作为
label, 加入该label作为融合网络优 化的区域选
择, 5.将所述嵌入Transformer融合策略的融合
权重学习模 型与编码器解码器级联, 构建红外与
可见光图像融合网络并训练。 该方法利用
Transformer捕获多尺度特征的全局关联性, 兼
顾局部与全局信息, 提升融合图像整体视觉效
果; 利用多模式自适应融合策略, 保留图像多模
式特征信息, 提高 融合图像的质量。
权利要求书3页 说明书8页 附图3页
CN 114639002 A
2022.06.17
CN 114639002 A
1.一种基于多模式特 征的红外与可 见光图像融合方法, 其特 征在于, 包括以下步骤:
步骤1, 构 建特征提取和图像重构网络, 基于多尺度卷积网络, 通过loss函数的的引导,
优化生成一个多模式特 征编码器 ‑解码器网络;
步骤2, 通过所述编码器 ‑解码器网络提取红外与可见光多模式特征, 使用熵、 梯度和显
著性对所述多模式特 征进行度量, 并设计多模式自适应l oss。
步骤3, 构建嵌入Transformer融合策略的融合权重学习模型, 并为所述融合模型的权
重赋值;
步骤4, 获取红外图像的显著性图作为l abel, 加入显著性label作为融合网络优化的区
域选择;
步骤5, 将所述嵌入Transformer融合策略的融合权重学习模型与编码器解码器级联,
构建红外与可见光图像融合网络, 并采用所述显著性label和多模式loss对所述红外与可
见光图像融合网络进行训练。
2.如权利要求1所述的方法, 其特征在于, 步骤1中所述编码器的结构包含: 1个1 ×1卷
积层和4个编码卷积模块ECB10、 ECB 20、 ECB30和ECB40, 每个编码卷积模块包含2 个3×3卷积
层和一个最大池化层;
步骤1中所述解码器的结构包含: 1个1 ×1卷积层和6个解码卷积模块DCB30、 DCB20、
DCB21、 DCB10、 DCB1 1和DCB12, 每 个解码卷积模块包 含两个3×3卷积层。
3.如权利要求1所述的方法, 其特征在于, 步骤1中所述解码器网络具体连接方式如下:
在第一、 第二尺度中采用横向密集跳转连接, 采用通道连接方式, 将第二尺度的最 终融合特
征跳转连接到DBC21的输入, 将第一尺度的最终 融合特征跳转连接到DCB11和DCB12的输入,
将DCB10的输出跳转连接到DCB12的输入; 通过横向密集跳转连接, 所有中间层的深度特征
都被用于特征重构, 提高多尺度深度特征的重构能力; 在解码子网络中, 在所有尺度中建立
纵向密集连接, 采用上采样方式, 将第四尺度的最终融合特征连接到DCB30的输入, 第三尺
度的最终融合特征连接到DCB20的输入, 第二尺度的最终融合特征连接到DCB10的输入, 将
DCB30的输出连接到DCB21的输入, DCB20的输出连接到DCB11的输入, DCB21的输出连接到
DCB12的输入, 通过纵向密集上采样连接, 所有尺度特征被用于特征重构, 进一步提高多尺
度深度特 征的重构能力。
4.如权利要求1所述的方法, 其特征在 于: 编码器 ‑解码器网络的loss函数LED, 其为输入
图像与输出图像之间的像素一 致性和结构相似性, 如公式(1)所示:
LED=Lp+β Lssin (1)
其中Lp为像素一 致性loss, Lssin为结构相似性 loss;
像素一致性lossLp如公式(2)所示:
结构相似性 lossLssin如公式(3)所示:
Lssim=1‑ssim(O, I) (3)
其中, O为网络 输出图像, I 为输入图像。
5.如权利要求1所述的方法, 其特征在于, 步骤2中所述使用熵、 梯度和显著性对所述多
模式特征进行度量包 含以下步骤:权 利 要 求 书 1/3 页
2
CN 114639002 A
2步骤2.1, 计算所述编码器输出的特征的熵, 比较各个尺度特征的熵值, 熵最高的特征
包含最多的内容与细节, 将其归类为内容特 征;
步骤2.2, 使用Sobel梯度算子计算所述编码器输入图像的梯度, 将该梯度进行下采样
后与各特征做差, 并求均值, 所得均值最小的特征包含更多的轮廓、 边缘等结构性特征, 将
其归类为 边缘结构性特 征;
步骤2.3, 使用显著性提取算法计算所述编码器输入图像的显著性图, 将该显著性图进
行下采样后与各特征做差, 并求均值, 所得均值最小的特征对前景目标与背景有一定的区
分, 将其归类 斑块特征。
6.如权利要求1所述的方法, 其特征在于: 步骤2中所述多模式自适应loss函数包含内
容loss, 相关性 loss和类显著性 loss, 如公式(4)所示:
Lfea=Lcon+λLcorr+ρ Lsil‑l (4)
其中, Lcon为内容loss, Lcorr为相关性loss, Lsil‑l为类显著性loss, λ和ρ 为超参数, 用于
平衡三个l oss的权重;
内容lossLcon增强对特 征的融合, 如公式(5)所示:
其中, wir和wvi为自适应权 重,
wvi=1‑wir;
相关性lossLcorr增强对边 缘结构性特 征的融合, 如公式(6)所示:
其中, cov( ·)为协方差函数, σ 为标准差函数。
类显著性 lossLsal‑l增强对斑块特 征的融合, 如公式(7)所示:
其中, Φir为红外特征, Φvi为可见光特征, Φf为将红外和可见光特征通过融合网络融
合后的特 征, Mir和Mvi为去除特 征中噪声的Mask, 如公式(8)和(9)所示:
其中, θ 为常数。
7.权利要求1所述的方法, 其特征在于, 步骤3中所述的融合网络结构如下: 包含4个
Transformer模块, 每个Transformer模块由2个1 ×1卷积层和1个Focal Transformer模块
组成; 第1个卷积层调整特征通道, Focal Transformer模块结合局部与全局信息对特征进权 利 要 求 书 2/3 页
3
CN 114639002 A
3
专利 一种基于多模式特征的红外与可见光图像融合方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:16:35上传分享