(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210128684.8
(22)申请日 2022.02.11
(71)申请人 北京地平线信息技 术有限公司
地址 100094 北京市海淀区丰豪东路9号院
2号楼3层1单 元301
(72)发明人 何飞 单言虎 苏治中 廖杰
赵鑫 黄凯奇
(74)专利代理 机构 北京弘权知识产权代理有限
公司 11363
专利代理师 郭放 许伟群
(51)Int.Cl.
G06V 20/40(2022.01)
G06K 9/62(2022.01)
G06V 10/80(2022.01)
(54)发明名称
一种物体 检测方法及装置
(57)摘要
本公开实施例公开了一种物体检测方法及
装置, 其中, 物体检测方法包括: 基于待检测视频
中各视频帧的特征, 确定各视频帧中的关键帧和
非关键帧; 通过对关键帧中的目标关键帧的对象
特征和其他 关键帧的对象特征进行特征聚合, 确
定目标关键帧的检测结果, 并通过应用关键帧的
对象特征对 所述非关键帧的对象特征进行修正,
确定所述非关键帧的检测结果。 其中, 通过对关
键帧的对象特征与其他关键帧的对象特征进行
特征聚合, 增强关键帧的特征质量, 提高对关键
帧进行物体检测的准确度, 并且, 该方案基于非
关键帧的修正后的对象特征对非关键帧的对象
特征进行修正, 相应提高了检测非关键帧的准确
度。 因此, 本公开的方案能够提高物体检测的准
确度。
权利要求书3页 说明书16页 附图9页
CN 114463682 A
2022.05.10
CN 114463682 A
1.一种物体 检测方法, 包括:
基于待检测视频中各视频帧的特 征, 确定所述各视频帧中的关键帧和非关键帧;
通过对所述关键帧中的目标关键帧的对象特征和其他关键帧的对象特征进行特征聚
合, 确定所述目标关键帧的检测结果;
通过应用所述关键帧的对象特征对所述非关键帧的对象特征进行修正, 确定所述非关
键帧的检测结果。
2.根据权利要求1的方法, 其中, 所述基于待检测视频中各视频帧的特征, 确定所述各
视频帧中的关键帧和非关键帧, 包括:
若所述视频帧为所述待检测视频的第一帧, 确定所述视频帧为所述关键帧, 所述第一
帧为所述待检测视频中最 早生成的视频帧;
若所述视频帧为除第 一帧以外的其他帧, 确定所述视频帧的特征与第 一关键帧的特征
之间的差异值, 所述第一关键帧为关键帧集 合中, 生成时刻距离当前时刻最近的关键帧;
若所述差异值大于 差异阈值, 确定所述视频帧为所述关键帧;
若所述差异值 不大于所述差异阈值, 确定所述视频帧为所述非关键帧。
3.根据权利要求1所述的方法, 其中, 所述通过对目标关键帧的对象特征和其他关键帧
的对象特 征进行特征聚合, 确定所述目标关键帧的检测结果, 包括:
确定所述目标关键帧的对象特 征和所述对象特 征的空间位置;
基于所述目标关键帧的对象特征和所述对象特征的空间位置的置信度, 更新短时记
忆, 其中, 所述短时记忆用于存储不多于M个关键帧的对象特征和所述对象特征的空间位
置, M为预设的正整数;
基于所述短时记忆中出栈的对象特征更新长时记忆, 所述长时记忆用于存储所述其他
关键帧的对象特 征;
基于所述长时记忆中的对象特征和所述短时记忆中存储的所述对象特征和所述对象
特征的空间位置, 对所述目标关键帧的对象特 征进行特征聚合;
基于所述目标关键帧在特 征聚合后的对象特 征, 确定所述目标关键帧的检测结果。
4.根据权利要求3所述的方法, 其中, 所述确定所述目标关键帧的对象特 征, 包括:
提取所述目标关键帧的多个初始对象特 征;
计算所述目标关键帧的多个初始对象特征分别与所述目标关键帧中各区域的特征之
间的相似度;
确定所述相似度符合第一预设条件的所述初始对象特 征为修正后的对象特 征;
基于所述修正后的对象特征与所述目标关键帧中各区域的特征之间的相似度, 对所述
修正后的对象特 征进行再次修正, 直至修 正次数达 到预设次数;
在所述修正 次数达到预设次数之后, 将符合第 二预设条件的对象特征确定为所述目标
关键帧的对象特 征。
5.根据权利要求3所述的方法, 其中, 所述基于所述长时记忆中的对象特征和所述短时
记忆中存储的所述对象特征和所述对象特征的空间位置, 对所述目标关键帧的对象特征进
行特征聚合, 包括:
从所述长时记 忆中选择T个对象特 征;
基于所述T个对象特征分别与所述短时记忆中的对象特征和所述目标关键帧的对象特权 利 要 求 书 1/3 页
2
CN 114463682 A
2征之间的余弦相似度, 确定所述T个对 象特征分别针对所述短时记忆中的对 象特征和所述
目标关键帧的对象特 征的第一权 重;
基于所述第一权重, 分别计算所述T个对象特征与所述短时记忆中的对象特征和所述
目标关键帧的对象特征之 间的加权和, 其中, 所述T个对象特征与所述短时记忆中的对象特
征的加权和为第一对 象特征, 所述T个对 象特征与所述 目标关键帧的对 象特征之间的加权
和为第二对象特 征;
基于所述第一对象特征、 所述短时记忆中存储的第一对象特征的空间位置、 所述第二
对象特征以及所述第二对象特征的空间位置, 确定所述第一对象特征与第二对象特征之间
的表观相似度和几何相似度;
基于所述第 一对象特征与第 二对象特征之间的表观相似度和几何相似度, 确定所述第
一对象特 征针对所述第二对象特 征的第二权 重;
基于所述第 二权重, 计算所述第 一对象特征与所述第 二对象特征之间的加权和, 其中,
所述第一对象特征与所述第二对 象特征之间的加权和 为所述目标关键 帧在特征聚合后的
对象特征。
6.根据权利要求1至5任一项所述的方法, 其中, 所述通过应用所述关键帧的对象特征
对所述非关键帧的对象特 征进行修 正, 确定所述非关键帧的检测结果, 包括:
基于第一视频帧的检测结果, 确定所述非关键帧的候选区域, 所述第一视频帧的生成
时刻与所述非关键帧的生成时刻之间的时间差在预设范围内;
提取所述非关键帧的候选区域中的对象特 征;
基于所述关键帧的对象特征对所述候选区域中的对象特征进行修正, 得到特征修正结
果;
基于所述特 征修正结果, 确定所述非关键帧的检测结果。
7.根据权利要求6所述的方法, 其中, 所述基于所述关键帧的对象特征对所述候选区域
中的对象特 征进行修 正, 得到特 征修正结果, 包括:
计算所述关键帧的对象特 征与所述 候选区域中的对象特 征之间的相似度;
确定所述相似度符合第三预设条件的所述 候选区域中的对象特 征为第三对象特 征;
对所述第三对象特征和所述关键帧的对象特征进行融合处理, 得到所述特征修正结
果。
8.一种物体 检测装置, 包括:
视频帧确定模块, 用于基于待检测视频中各视频帧的特征, 确定所述各视频帧中的关
键帧和非关键帧;
关键帧检测模块, 用于通过对所述视频帧确定模块确定的所述关键帧中的目标关键帧
的对象特 征和其他关键帧的对象特 征进行特征聚合, 确定所述目标关键帧的检测结果;
非关键帧检测模块, 用于通过应用所述视频帧确定模块确定的所述关键帧的对象特征
对所述视频帧确定模块确定的所述非关键帧的对象特征进 行修正, 确定所述 非关键帧的检
测结果。
9.一种计算机可读存储介质, 所述存储介质存储有计算机程序, 所述计算机程序用于
执行上述权利要求1 ‑7任一所述的物体 检测方法。
10.一种电子设备, 所述电子设备包括:权 利 要 求 书 2/3 页
3
CN 114463682 A
3
专利 一种物体检测方法及装置
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:18:50上传分享