安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210283673.7 (22)申请日 2022.03.22 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 舒畅 陈又新 (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 廖慧贤 (51)Int.Cl. G06V 10/40(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) (54)发明名称 图像描述方法和装置、 计算机设备、 存储介 质 (57)摘要 本实施例提供一种图像描述方法和装置、 计 算机设备、 存储介质, 属于 人工智能技术领域。 包 括: 对原始图像的目标区域卷积得到原始特征图 像; 对原始特征图像聚合得到聚合图像; 对聚合 图像进行自注 意力处理得到自注 意力图像, 对原 始特征图像进行扁平化处理得到平滑图像; 对平 滑图像进行特征提取得到初步特征图像; 关联原 始特征图像和初步特征图像得到目标特征图像; 对目标特征图像进行文本描述得到目标描述信 息。 通过对原始特征图像进行聚合, 并对聚合图 像进行自注 意处理得到图像的通道特征; 通过对 原始特征图像进行扁平化处理, 并对平滑图像进 行特征提取处理得到图像的空间特征; 本实施例 能够充分考虑到图像的各个特征, 进而提高图像 描述的准确率。 权利要求书2页 说明书14页 附图5页 CN 114648641 A 2022.06.21 CN 114648641 A 1.一种图像描述方法, 其特 征在于, 包括: 获取原始图像; 其中, 所述原 始图像包括目标区域; 对所述原 始图像的所述目标区域进行 卷积处理, 得到原 始特征图像; 对所述原 始特征图像进行聚合处 理, 得到聚合图像; 对所述聚合图像进行自注意力处 理, 得到自注意力图像; 根据所述自注意力图像对所述原 始特征图像进行扁平化处 理, 得到平 滑图像; 对所述平 滑图像进行 特征提取处 理, 得到初步特 征图像; 对所述原 始特征图像和所述初步特 征图像进行关联处 理, 得到目标 特征图像; 根据所述目标特征图像进行文本描述处理, 得到目标描述信 息; 其中, 所述目标描述信 息用于描述所述原 始图像。 2.根据权利要求1所述的方法, 其特征在于, 所述 聚合图像包括平均池化图像和最大池 化图像; 所述对所述原 始特征图像进行聚合处 理, 得到聚合图像, 包括: 对所述原 始特征图像进行平均池化处 理, 得到所述平均池化图像; 对所述原 始特征图像进行最大池化处 理, 得到所述 最大池化图像。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述聚合图像进行自注意力处理, 得到自注意力图像, 包括: 获取多层感知机的输出层权 重和隐藏层权 重; 将所述平均池化图像输入至所述多层感知机进行自注意力处理, 得到第一注意力图 像; 将所述最大池化图像输入至所述多层感知机进行自注意力处理, 得到第二注意力图 像; 根据预设的激活函数对所述输出层权重、 所述 隐藏层权重、 所述第一注意力图像和所 述第二注意力图像进行计算, 得到所述自注意力图像。 4.根据权利要求1所述的方法, 其特征在于, 所述根据所述自注意力图像对所述原始特 征图像进行扁平化处 理, 得到平 滑图像, 包括: 将所述原 始特征图像的像素和所述自注意力图像的像素相乘, 得到细化特 征图像; 根据预设尺寸对所述初步特 征图像进行尺寸变化处 理, 得到尺寸特 征图像; 对所述尺寸特 征图像进行张量平坦 化操作, 得到所述平 滑图像。 5.根据权利要求4所述的方法, 其特征在于, 所述对所述平滑图像进行特征提取处理, 得到初步特 征图像, 包括: 将所述平 滑图像输入至预设的神经网络模型; 通过所述神经网络模型计算所述平 滑图像的空间注意分布, 得到所述初步特 征图像。 6.根据权利要求1所述的方法, 其特征在于, 所述对所述原始特征图像和所述初步特征 图像进行关联处 理, 得到目标 特征图像, 包括: 根据预设的投影维度对所述原 始特征图像进行投影处 理, 得到第一投影图像; 对所述第一投影图像进行 特征细化处 理, 得到第一细化图像; 根据所述投影维度对所述初步特 征图像进行投影处 理, 得到第二投影图像; 对所述第二投影图像进行 特征细化处 理, 得到第二细化图像; 将所述第一细化图像的像素和所述第二细化图像的像素相乘, 得到所述目标特征图权 利 要 求 书 1/2 页 2 CN 114648641 A 2像。 7.根据权利要求1至6任一项所述的方法, 其特征在于, 所述根据所述目标特征图像进 行文本描述处 理, 得到目标描述信息, 包括: 获取历史特 征图像; 对所述目标 特征图像和所述历史特 征图像进行 特征融合处 理, 得到融合特 征图像; 对所述融合特 征图像进行解码处 理, 得到所述目标描述信息 。 8.一种图像描述装置, 其特 征在于, 包括: 图像获取模块: 用于获取原 始图像; 其中, 所述原 始图像包括目标区域; 区域卷积模块: 用于对所述原始图像的所述目标区域进行卷积处理, 得到原始特征图 像; 图像聚合模块: 用于对所述原 始特征图像进行聚合处 理, 得到聚合图像; 自注意力处 理模块: 用于对所述聚合图像进行自注意力处 理, 得到自注意力图像; 扁平化处理模块: 用于根据所述自注意力图像对所述原始特征图像进行扁平化处理, 得到平滑图像; 特征提取模块: 用于对所述平 滑图像进行 特征提取处 理, 得到初步特 征图像; 图像关联模块: 用于对所述原始特征图像和所述初步特征图像进行关联处理, 得到目 标特征图像; 文本描述模块: 用于根据 所述目标特征图像进行文本描述处理, 得到目标描述信 息; 其 中, 所述目标描述信息用于描述所述原 始图像。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器和 处理器, 其中, 所述存 储器中存储有计算机程序, 所述计算机程序被所述处理器执行时所述处理器用于执行: 如 权利要求1至7中任一项所述的方法。 10.一种存储介质, 所述存储介质为计算机可读存储介质, 其特征在于, 所述计算机可 读存储有计算机程序, 在所述计算机程序被计算机执行时, 所述计算机用于执行: 如权利要 求1至7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114648641 A 3
专利 图像描述方法和装置、计算机设备、存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 01:20:27
上传分享
举报
下载
原文档
(850.3 KB)
分享
友情链接
GB-T 5462-2015 工业盐.pdf
GM-T 0028-2014 密码模块安全技术要求.pdf
GB-T 24549-2020 燃料电池电动汽车 安全要求.pdf
GB-T 3977-2008 颜色的表示方法.pdf
YD-T 3956-2021 电信网和互联网数据安全评估规范.pdf
GB-T 31991.1-2015 电能服务管理平台技术规范 第1部分:总则.pdf
密码使用管理制度.pdf
DB5111-T 25-2022 嘉州菜 乐山甜皮鸭制作工艺规范 乐山市.pdf
DB31-T 1408-2023 医学检验实验室管理规范 上海市.pdf
T-BSIA 006—2022 知识图谱时空特性构建技术规范.pdf
CCIA 中国网络安全产业分析报告 2022年 .pdf
工业互联网标识管理办法.pdf
T-GHDQ 106—2022 车辆远程升级信息安全测试规范.pdf
GB-T 41871-2022 信息安全技术 汽车数据处理安全要素.pdf
T-ACEF 110—2023 公民绿色低碳行为温室气体减排量化指南 行:机动车停驶.pdf
GB-T 30428.1-2013 数字化城市管理信息系统 第1部分:单元网格.pdf
GB-T 14352.13-2010 钨矿石、钼矿石化学分析方法 第13部分:锡量测定.pdf
GB-T 19791-2005 温室防虫网设计安装规范.pdf
GB 21148-2020 足部防护 安全鞋.pdf
GB-T 33592-2017 分布式电源并网运行控制规范.pdf
1
/
3
22
评价文档
赞助2.5元 点击下载(850.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。