安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210124768.4 (22)申请日 2022.02.10 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 查正军 傅雪阳 曹成志 时格格  黄宇坤  (74)专利代理 机构 安徽省合肥新 安专利代理有 限责任公司 34101 专利代理师 陆丽莉 何梅生 (51)Int.Cl. G06T 5/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 20/40(2022.01)G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于事件数据驱动的视频去 模糊方法 (57)摘要 本发明公开了一种基于事件数据驱动 的视 频去模糊方法, 其步骤包括: 1获取视频数据和对 应的事件序列, 并对事件序列进行分割; 2构建编 码网络对图像数据进行特征提取; 3通过时间记 忆模块计算相邻事件序列的关联性, 提取时间特 征; 4通过空间融合模块将事件特征和图像特征 进行空间尺度的融合; 5构建解码网络生成去模 糊之后的视频帧。 本发明能够 充分利用事件数据 提供的时空先验信息, 用于驱动视频去模糊, 从 而有效提升去 模糊效果。 权利要求书2页 说明书6页 附图3页 CN 114463218 A 2022.05.10 CN 114463218 A 1.一种基于事 件数据驱动的视频去模糊方法, 其特 征是按如下步骤进行: 步骤1获取训练视频 数据和对应的事 件序列, 并对 事件序列进行分割: 步骤1.1获取训练视频 数据集: 获取真实的模糊视频图像集, 记为X={x1,x2,…,xi,…,xN}, 其中, xi表示第i张模糊图 像, i=1,2,…,N, N为模糊图像的帧数量; 获取真实的清晰视频图像集, 记为Y={y1,y2,…,yi,…,yN}, 其中, yi表示第i张清晰图 像, i=1,2,...,N, N为正常图像的总数; 令I={X,Y}表示训练图像数据集; 步骤1.2对 事件序列进行分割: 获取真实的模糊图像集X的真实事 件序列; 将真实的模糊视频图像集X输入 事件仿真器中并生成合成的事 件序列; 根据真实的模糊视频图像集X中所包含的帧数量N, 将真实事件序列和合成的事件序列 分别划分成相同数量N的分段序列, 记为E={e1,...,ei,...,eN},ei表示第i张模糊图像xi所 对应的真实和合成的事 件序列, i =1,2,...,N, N为事件序列的总数; 步骤2构建视频去模糊神经网络, 包括: 编码网络、 时间记忆模块、 空间融合模块、 解码 网络; 步骤2.1、 所述编码网络由M个残差模块和M个下采样层交替排列组成, 其中, 残差模块 具有m个卷积层及其对应的跳线连接, 卷积核大小为均为ks, 步长均为s, 各卷积层之间依次 连接有LeakRelu层和批归一 化层; 所述第i张模糊图像xi经过所述编码网络的处理后, 生成M个不同尺度的图像特征 其中, uim表示第i张模糊图像xi在第m个尺度的图像特 征; 步骤2.2、 所述时间记 忆模块包括 一个公用的卷积层、 两个专用的卷积层、 记 忆单元; 第i‑1个事件序列ei‑1和第i+1个事件序列ei+1输入公用的卷积层中进行处理, 得到两者 的公共特征, 再分别经过两个专用的卷积层的处理, 相应得到第i ‑1个事件序列ei‑1的键和 值以及第i+1个事 件序列ei+1的键和值; 所述记忆单元将第i ‑1个事件序列ei‑1的键和值以及第i+1个事件序列ei+1的键和值进 行拼接后, 再分别输入两个卷积核为1 ×1的卷积层中, 输出两个卷积结果后再通过乘积运 算得到第i个事件序列ei与相邻事件序列ei‑1和ei+1的关联特征图; 最后将所述关联特征图 与第i个事 件序列ei相加后, 得到第i个事 件特征图Ci; 步骤2.3、 所述空间融合模块包括M+1个下采样层、 M个上采样层、 一个卷积核为1 ×1的 卷积层和融合单 元; 所述M个不同尺度的图像特征 输入所述空间融合模块中, 并分别通过M个下 采样层的处理, 从而将M个不同尺度的图像特征调整为相同比例的图像特征, 再经过一个卷 积核为1×1的卷积层后获得第i个特 征图Fi; 所述第i个事件特征图Ci通过第M+1个 下采样层的处理后, 得到 下采样后的第i个事件特 征图C′i; 所述融合单元利用式(1)对所述下采样后的第i个事件特征图C ′i和第i个特征图Fi进行 处理, 从而得到第i个融合特征图Fe ati中第p个像素点的特征 进而得到第i个融合特权 利 要 求 书 1/2 页 2 CN 114463218 A 2征图Feati: 式(1)中, p、 q是位置索引, 表示第i个事件特征图C ′i在p位置处的特征值, Fiq表示第i 个特征图Fi在q位置处的特征值, S为特征图的像素点总数; g( ·)表示卷积操作; f( ·,·) 表示乘积函数, 并有: 式(2)中, θ( ·)和 均表示卷积 操作; 所述第i个融合特征图Feati分别经过M个上采样层的处理后, 获得M个不同尺度的映射 特征 其中, vim表示第i张模糊图像xi在第m个尺度的图像特 征; 步骤2.4、 所述解码网络由M个残差模块和M个上采样层交替排列组成, 其中, 残差模块 具有m个卷积层及其对应的跳线连接, 卷积核大小为均为ks, 步长均为s, 各卷积层之间依次 连接有LeakRelu层和批归一 化层; 所述M个不同尺度的映射特征 经过所述解码网络的上采样层处理, 获得M个 尺度一致的特征图并进行拼接之后, 再 经过一个卷积 操作, 从而生成清晰图像 步骤3、 利用式(3)构建反向传播的损失函数L: 式(3)中, K为生成清晰图像 的像素点数, 为第i个模糊图像经过神经网络生成的去 模糊图像的第k个 像素点, 为清晰视频图像集中第i个图像切片对应的第k个 像素点; 步骤4、 基于真实的模糊图像集X及其分段序列E对视频去模糊神经网络进行训练, 并计 算损失函数L, 同时使用自适应矩估计优化方法以学习率lrs来更新静态检测网络权值, 当 训练迭代次数达到设定的次数或损失误差达小于所设定的阈值时, 训练停止, 从而得到最 优的去模糊 模型; 以所述最优的去模糊网络对模糊视频图像进行处理, 并获得对应的清晰 图像。权 利 要 求 书 2/2 页 3 CN 114463218 A 3

.PDF文档 专利 一种基于事件数据驱动的视频去模糊方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于事件数据驱动的视频去模糊方法 第 1 页 专利 一种基于事件数据驱动的视频去模糊方法 第 2 页 专利 一种基于事件数据驱动的视频去模糊方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:15:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。