安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210308741.0 (22)申请日 2022.03.26 (71)申请人 西北农林科技大 学 地址 712100 陕西省咸阳市杨凌示范区西 农路南段3号 (72)发明人 马宇辰 李书琴  (51)Int.Cl. G06F 16/36(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于关系嵌入和卷积神经网络的知识 图谱补全方法 (57)摘要 该发明专利名为 “一种基于关系嵌入和卷积 神经网络的知识图谱补全方法 ”。 通过将知识图 谱中三元 组的实体和关系视为翻译的过程, 并通 过最有代表性的平移距离模型TransE来训练数 据得到实体和关系的嵌入向量。 其次通过融合不 同嵌入向量形成新的向量表示, 并与融合前的嵌 入向量组成向量矩阵, 提高知识图谱三元组整体 信息特征的表达。 使用不同大小卷积核提取向量 矩阵的深层特征信息, 将不同卷积核提取到的不 同维度的特征结果接入全 连接层, 得到最终的分 数, 以此来判断知识图谱三元组是否合理, 该发 明有效提高了基于知识 图谱智能问答系统数据 库的准确性和完整性。 权利要求书1页 说明书3页 附图3页 CN 114625890 A 2022.06.14 CN 114625890 A 1.一种基于关系嵌入和卷积神经网络的知识图谱补全方法KGCRC, 包括融合不同嵌入 向量形成新的向量表示, 利用不同大小卷积核提取向量矩阵的深层特征信息。 即将知识图 谱中的实体和关系视为翻译的过程, 并通过最有代表性的平移距离模型来训练数据得到实 体和关系的嵌入向量。 其次通过融合不同嵌入向量形成新的向量表示, 并与融合前 的嵌入 向量组成向量矩阵, 提高知识图谱三元组整体信息特征 的表达。 使用不同大小卷积核提取 向量矩阵的深层特征信息, 将不同卷积核提取到的不同维度的特征结果接入全连接层, 得 到最终的分数, 以此来判断知识图谱三元组是否合理, 有效提高了基于知识图谱智能问答 系统数据库的准确性。 2.根据权利要求1所述融合不同嵌入向量形成新的向量表示。 其特征在于: 将知识图谱 三元组数据转化为一个k维3列的向量矩阵。 其转化方式如式(1)所示。 不同向量之间的融合 方式如式(2)、 式(3)、 式(4)所示。 利用向量融合的方式使得三元组各个结点之间的信息进 行交互, 从而提高知识图谱三元组信息的表达能力。 vhr=w(vh+vr)+b                                   (2) vht=w(vh+vt)+b                                  (3) vrt=w(vr+vt)+b                                  (4) 3.根据权利要求1所述利用不同大小卷积核提取向量矩阵的深层特征信息。 其特征在 于: 为了使三元 组信息的局部特征和全局特征进行重复的表达。 使用3x3, 4x4, 5x5, 6x6四个 不同大小的卷积核提取向量矩阵A ′=[vh,vhr,vr,vrt,vt,vht]的特征。 使用式(5)来更新特征 提取过程中的参数, 使用式(6)来计算 三元组的最终得分。 f(h,r,t)=co ncat(g([vh,vhr,vr,vrt,vt,vht]*Ω))·w                      (6)权 利 要 求 书 1/1 页 2 CN 114625890 A 2一种基于关系嵌入和卷积神经 网络的知识图谱补全方 法 所属技术领域 [0001]本发明属于知识图谱领域, 涉及深度学习、 卷积神经网络、 关系嵌入的知识图谱补 全方法(Knowledge  graph Completion  based on Relational  Embedding  and CNN, KGCRC), 实现了知识图谱的自动补全模型, 提高了基于知识图谱智能问答系统知识库的完 整性和准确性。 背景技术 [0002]知识图谱是一种用图数据模型来描述现实世界信息以及信息之间联系的结构化 的复杂语义网络, 其数据通常以三元组(h,r,t)的形式进行存储。 在知识图谱网络中, 节点 用来表示现实中的事实实体, 节点之间的边用来表示实体之间的关系, 其结构形式能更好 地与智能问答系统相结合, 更加适合作为智能问答系统的数据来源, 在提高专业知识集成 效率的同时又能 降低获取知识门槛, 具有很强的人机交互性, 所以被广泛地应用于智能问 答系统, 智能推荐系统和聊天机器人。 但知识图谱 具有天生的不完整性, 因此需要对知识图 谱进行补全, 知识图谱补全是伴 随着知识图谱构建而产生的, 目的是向知识图谱中增加 新 的三元组, 从层次上区分可分为概念层次和实例层次。 但传统的知识图谱补全模型仅仅关 注了三元组的结构信息或局部特征信息, 仍将三元组的各个节点当做相互独立的部 分忽视 了三元组整体信息这一影响知识图谱补 全最终结果的重要因素, 导致知识图谱补全的效果 不佳, 从而使知识图谱无法更好地应用于智能问答系统。 本发明结合知识图谱的数据复杂 特性, 提出了基于 关系嵌入和卷积神经网络的知识图谱补 全KGCRC方法, 通过基于知识图谱 的花椒种植智能问答系统(Zanthoxylum  bungeanum Knowledge  Graph Q&A System)在仿 真和实际环境中实现对知识图谱的补全, 提高知识图谱数据库的完整性和准确 性, 该发明 对促进基于知识图谱的智能问答系统发展颇具现实意 义。 发明内容 [0003]本发明的目的是提供一种基于关系嵌入和卷积神经网络的知识图谱补全方法 KGCRC, 可以通过对知识图谱的数据进行深层特征进行提取, 充分挖掘三元组的整体信息, 从而提高智能问答系统知识图谱补全的精确 率和鲁棒性。 为实现上述 目的, 本发明将知识 图谱中的实体和关系视为翻译的过程, 并通过最有代表性的平移距离模型来训练数据得到 实体和关系的嵌入向量。 其次通过融合不同嵌入向量形成新的向量表示, 并与融合前 的嵌 入向量组成向量矩阵, 提高知识图谱三元组整体信息特征 的表达。 使用不同大小卷积核提 取向量矩阵的深层特征信息, 将不同卷积核提取到的不同维度的特征结果接入全连接层, 得到最终的分数, 以此来判断知识图谱三元组是否合理, 有效提高了基于知识图谱智能问 答系统数据库的准确性。 [0004]本发明解决其技术问题所采用的技术方案是处理器为Inter  Core i7‑4790H,内 存容量为16GB, Windows  10操作系统, 开发软件为PyCharm  2021.2.2, 使用Python语言编 写。说 明 书 1/3 页 3 CN 114625890 A 3

.PDF文档 专利 一种基于关系嵌入和卷积神经网络的知识图谱补全方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于关系嵌入和卷积神经网络的知识图谱补全方法 第 1 页 专利 一种基于关系嵌入和卷积神经网络的知识图谱补全方法 第 2 页 专利 一种基于关系嵌入和卷积神经网络的知识图谱补全方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:51:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。