安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210277651.X (22)申请日 2022.03.21 (71)申请人 天津大学 地址 300072 天津市南 开区卫津路9 2号 (72)发明人 胡琪瑶 王旗龙 胡清华  (74)专利代理 机构 天津市北洋 有限责任专利代 理事务所 12 201 专利代理师 韩帅 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/46(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/62(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于自适应多粒度时空建模的细粒度 视频识别方法 (57)摘要 本发明公开了一种基于自适应多粒度时空 建模的细粒度视频识别方法, 所述方法基于深度 神经网络、 细粒度CPTM模块和粗粒度CSTP模块; 包括如下步骤: 所述细粒度CP TM模块并入深度神 经网络提取细粒度的时间线索; 所述细粒度CPTM 模块是以渐进时间卷积和竞争式融合机制进行 构建; 提高视频动作识别的性能, 具备捕获视频 中复杂尺度变化的时空线索的能力。 权利要求书2页 说明书9页 附图2页 CN 114612842 A 2022.06.10 CN 114612842 A 1.一种基于自适应多粒度时空建模的细粒度视频识别方法, 其特征在于: 所述方法基 于深度神经网络、 细粒度CPTM模块和粗粒度CSTP模块; 包括如下步骤: 所述细粒度CPTM模块并入深度神经网络提取细粒度的时间线索; 所述细粒度CPTM模块是以渐进时间卷积和竞争式 融合机制进行构建; 包括: 以计算尺度k的时间特 征的一组多尺度特 征.表示为: yk=G(Wk)⊙yk‑1,k=1,…,K, 其中, y0= χ且G(Wk)表示权重为Wk的时间卷积; 所述细粒度CPTM模块以竞争式 融合机制对多尺度特 征融合可表示 为: 其中, 维度为C的向量h通过对时空特征全局平均池 化(GAP), 以捕获多时间尺度{y1,…, yK}的全局上下文关系, 即 是通过两个权重分别为 的 全连接层计算得到; ⊙表示沿通道维度的点积运算; τ则是决定多尺度特征之间竞争或协作 模式的一个平衡参数; 所述粗粒度CSTP模块并入深度神经网络提取融合 粗粒度的时空特 征; 包括: 所述粗粒度CSTP模块采用两阶段自适应融合机制, 表示 为: 其中, φup、 φdw和φz是三个核大小为1 ×1的2D卷积层, 而标识[ ·;·]表示特征间的连 接操作; 权重 和 由输入 通过函数g1计算得到; 输出Zup和Zdw作 为函数g2输入, 计算出权 重ωup和ωdw。 2.根据权利要求1所述的一种基于自适应多粒度时空建模的细粒度视频识别方法, 其 特征在于: 所述细粒度CPTM模块和所述 粗粒度CSTP模块并入2D深度神经网络过程: 在2D深度神经网络的卷积阶段间有选择性地插入CPTM模块, 提取当前连续卷积阶段间 的特征的细粒度时间线索: 设 为第l阶段第i残差块(resl,i)的输出, 其中W表示宽度, H表示高度, T 表示时间维度以及C表示 通道数; CPTM模块(fCPTM)在该层输入特 征 所提取细粒度时间线索可以表示 为: 其中, Nl为resl的最后一个残差块, 该输出y(l)为下一阶段resl+1,1的输入; 所述CSTP模块是采用如下公式将不同卷积阶段的时空分辨率特征进行自适应融合输 出:权 利 要 求 书 1/2 页 2 CN 114612842 A 2Z=fCSTP(y(L‑1),y(L)) 其中: L表示深度卷积网络中阶段总数, Z则用于融合特 征后的最后预测。 3.根据权利要求1所述的一种基于自适应多粒度时空建模的细粒度视频识别方法, 其 特征在于: 所述细粒度CPTM模块和所述 粗粒度CSTP模块并入3D深度神经网络过程: 在3D深度神经网络将CPTM模块和2D空间卷积以残差方式结合, 构建出3DCPTM层结构, 并 通过3DCPTM层代替残差网络中原有的3D卷积层, 以达 到提取细粒度时间线索目的; 所述CSTP模块是采用如下公式将不同卷积阶段的时空分辨率特征进行自适应融合输 出: 其中: Z同样表示自适应融合 跨不同时空分辨 率的粗粒度特 征信息。权 利 要 求 书 2/2 页 3 CN 114612842 A 3

.PDF文档 专利 一种基于自适应多粒度时空建模的细粒度视频识别方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于自适应多粒度时空建模的细粒度视频识别方法 第 1 页 专利 一种基于自适应多粒度时空建模的细粒度视频识别方法 第 2 页 专利 一种基于自适应多粒度时空建模的细粒度视频识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:17:41上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。