(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210149254.4
(22)申请日 2022.02.18
(71)申请人 苏州玖合智能科技有限公司
地址 215131 江苏省苏州市相城经济技 术
开发区澄阳街道澄阳路116号阳澄湖
国际科技创业园3号楼3 05室
(72)发明人 张修文
(74)专利代理 机构 南京科阔知识产权代理事务
所(普通合伙) 3240 0
专利代理师 苏兴建
(51)Int.Cl.
G06V 40/20(2022.01)
G06V 40/10(2022.01)
G06V 20/52(2022.01)
G06V 10/80(2022.01)G06V 10/82(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
(54)发明名称
地铁车站的行 人行为检测系统
(57)摘要
一种地铁车站的行人行为检测系统, 包括网
络监控摄像头和交换机, 网络监控摄像头有多
个; 还包括图像预检测模块; 每个网络监控摄像
机的输出端连接一个图像预检测模块; 图像预检
测模块以CP U和GPU为核心; 网络监控摄像头输 出
图像由相应的图像预检测模块处理, 并把相应处
理结果存储在存储器, 再由后台管理端经交换机
调取; 在图像预处理模块中, 采用行为检测算法
对输入的视频帧进行处理, 得到具有检测框的行
人图像; 行为检测算法采用改良YOLOv5网络模
型, 改良方法是在YOLOv5网络加入可变形卷积
网、 在YOLOv5网络的特征提取网络中加入注意力
机制, 以及在YOLOv5网络读特征提取完成后, 进
行多尺度的特 征图构建特 征金字塔。
权利要求书1页 说明书2页 附图1页
CN 114694247 A
2022.07.01
CN 114694247 A
1.一种地铁车站的行人行为检测系统, 包括网络监控摄像头和 交换机, 其特征是所述
网络监控摄像头有多个; 还包括图像预检测模块; 每个网络监控摄像机的输出端连接一个
图像预检测模块;
图像预检测模块以CPU和GPU为核心, 且具有存储器; 网络监控摄像头输出图像由相应
的图像预检测模块处 理, 并把相应处 理结果存 储在存储器, 再由后台管理端经交换机调取;
在图像预处理模块中, 采用行为检测算法对输入的视频帧进行处理, 得到具有检测框
的行人图像;
行为检测算法采用改良YOLOv5网络模型, 改良方法包括:
在YOLOv5网络加入可变形卷积网、 在YOLOv5网络 的特征提取网络中加入注意力机制,
以及在YOLOv5网络读特 征提取完成后, 进行多尺度的特 征图构建特 征金字塔。
2.根据权利 要求1所述的地铁车站的行人行为检测系统, 其特征是YOLOv5网络模型中,
对YOLOv5网络进行训练: 首先, 进行行人数据采集, 采用旋转、 翻转及随机裁剪等数据增广
的方法扩 大样本, 每三十到六十帧截取一张图像。 增强处理后的图像进入分类网络, 经过多
层卷积, 提取图像特 征信息, 生成不同尺度的特 征图, 形成特 征金字塔进入检测网络 。
3.根据权利要求1所述的地铁车站的行人行为检测系统, 其特征是对YOLOv5网络进行
修改: 在YOLOv5网络加入可变形卷积网, YOLOv5中的特征金字塔结构采用自下而上的方式
进行特征融合, 3个特征层的提取均与底层残差块的输出相关联, 使用可变形卷积替换了主
干网络中第4个残差块ResidualBl ock4部分的3 ×3卷积。
4.根据权利要求1所述的地铁车站的行人行为检测系统, 其特征是在YOLOv5网络的特
征提取网络中加入注意力机制, 将SENet通道注意力机制引入backbone中第二个卷积模块
后, 用于增强含有较大信息的通道特 征, 并对含有特征信息较少的通道进行抑制。
5.根据权利要求1所述的地铁车站的行人行为检测系统, 其特征是在YOLOv5网络读特
征提取完成后, 进行多尺度的特征图构建特征金字塔, 方法是先得到尺度最大 的特征层即
为第一特征层; 然后进 行一个上采样获得一个特征层; 再使用r oute层获取一个倒数第二次
下采样的卷积层; 将两个中尺度的特征层混合得到第二特征层, 以此类推, 得到第三特征层
和第四特 征层。权 利 要 求 书 1/1 页
2
CN 114694247 A
2地铁车站的行人行为检测系统
技术领域
[0001]本发明属于监控技 术领域, 具体涉及一种地铁车站的行 人行为检测系统。
背景技术
[0002]地铁车站场景的行人密集, 在实际的监控出行场景下, 由于行人目标与摄像头的
距离远近不一, 且角度非常多变。 导致在图像中行人的尺寸分布大小不一, 不易检测, 导致
行人目标漏检、 误检。 地铁复杂场景下目标元素过多导致特征信息 分析较慢, 检测速度达不
到实时。
[0003]为了克服上述不利影响, 本系统对传统的神经网络进行改进, 降低对原始图像的
要求, 提高识别效率, 减轻系统硬件资源消耗。
发明内容
[0004]为了解决上述技术问题, 本发明提出一种地铁车站的行人行为检测系统, 包括网
络监控摄像头和交换机, 网络监控摄像头有多个; 还包括图像预检测模块; 每个网络监控摄
像机的输出端连接一个图像预检测模块; 图像预检测模块以CPU和GPU为核心, 且具有存储
器; 网络监控摄像头输出图像由相 应的图像预检测模块处理, 并把相应处理结果存储在存
储器, 再由后台管理端经交换机调取;
[0005]在图像预处理模块中, 采用行为检测算法把对输入的视频帧进行处理, 得到具有
检测框的行 人图像;
[0006]行为检测算法采用改良YOLOv5网络模型, 改良方法包括:
[0007]在YOLOv5网络加入可变形卷积网、 在 YOLOv5网络的特征提取 网络中加入注意力机
制, 以及在YOLOv5网络读特 征提取完成后, 进行多尺度的特 征图构建特 征金字塔。
[0008]对YOLOv5网络进行训练, 首先, 进行行人数据采集, 采用旋转、 翻转及随机裁剪等
数据增广的方法扩大样本, 每三十到六十帧截取一张图像。 增强处理后的图像进入分类网
络, 经过多层卷积, 提取图像特征信息, 生成不同尺度的特征图, 形成特征金字塔进入检测
网络。
[0009]在YOLOv5网络加入可变形卷积网, YOLOv5中的特征金字塔结构采用自下而上的方
式进行特征融合, 3个特征层的提取均与 底层残差块的输出相关联, 因此提高底层残差模块
对特征图上不同大小感受野的适应能力能够在最大程度上提高模型的定位精度, 使用可变
形卷积替换了主干网络中第4个残差块(Residual Block4)部分的3 ×3卷积。
[0010]在YOLOv5网络的特征提取网络中加入注意力机制, 将SENet通道注意力机制引入
backbone中第二个卷积模块后, 用于增强含有较大信息的通道特征, 并对含有特征信息较
少的通道进行抑制, 改善对被遮挡 、 靠近群体等特征信息不明显目标的检测效果。
[0011]在YOLOv5网络读特征提取完成后, 进行多尺度的特征图构建特征金字塔, 方法是
先得到尺度最大 的特征层即为第一特征层; 然后进行一个上采样获得一个特征层; 再使用
route层获取一个倒数第二次下采样的卷积层; 将两个中尺度的特征层混合得到第二特征说 明 书 1/2 页
3
CN 114694247 A
3
专利 地铁车站的行人行为检测系统
文档预览
中文文档
5 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:20:35上传分享