安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210150878.8 (22)申请日 2022.02.18 (71)申请人 北京邮电大 学 地址 100876 北京市海淀区西土城路10号 (72)发明人 吴岳辛 范春晓 邹俊伟 王艺潼  刘峻辰  (74)专利代理 机构 北京市商 泰律师事务所 11255 专利代理师 邹芳德 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于图卷积神经网络和知识库的论文 相关性分析方法 (57)摘要 本发明提出了一种新的论文相关性分析方 法: 在论文集中提取关键信息, 构建论文集知识 库 , 结 合 图 卷 积 神 经 网 络 , 提 出 改 进 的 Inception ‑GCN模型完成论文类别划分, 使用 NOCO模型完成论文社区发现, 进而完成论文集知 识库中论文的相关性分析。 本发 明提出一个新的 图节点分类模型: Inc eption‑GCN模型。 将原 本用 于CNN模型的Inception方法与GCN模型结合, 能 够使新模型在增强特征学习能力的同时, 有效的 解决过拟合问题和平滑问题。 通过实验表明, 将 该模型用于论文节点分类, 可以达到比现有技术 更好的效果。 权利要求书2页 说明书5页 附图3页 CN 114741519 A 2022.07.12 CN 114741519 A 1.一种基于 图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 包括以下 步骤: 步骤一), 在论文集中提取关键性息, 构建论文集知识库; 步骤二), 论文类别划分, 将论文集的文献按照内容和涉及的方向进行划分, 结合图卷 积神经网络提出改进的Inception ‑GCN模型在构建好的论文集知识库上完成论文类别划分 工作, 将得到的类别属性添加到论文集知识库的论文实体中, 具体包括; 步骤2.1), 利用外 部知识对论文集进行部分类别标注; 步骤2.2), 结合图卷积神经网络提出改进的Inception ‑GCN模型半监督分类算法对未 标注论文分类; 步骤2.3), 在构建好的论文集知识库上完成论文类别划分工作, 将得到的类别属性添 加到论文集知识库的论文实体中; 步骤三), 使用基于图卷积神经网络的NOCO模型完成论文集的社区发现, 将得到的社区 属性添加到论文集知识库的论文实体中。 2.根据权利要求1所述的一种基于图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 所述的步骤一)中, 所述的构建论文集知识库为采用论文间的引用关系、 论文 与作者的著作关系 、 论文与专业 术语的包 含关系三种非线性关系进行构建论文集知识库。 3.根据权利要求2所述的一种基于图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 所述的专业 术语为通过部分人工标注结合命名实体识别方法得到的。 4.根据权利要求3所述的一种基于图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 所述的命名实体识别方法为SpaC y命名实体识别方法、 NLTK命名实体识别方法 或Stanford  NER命名实体识别方法中的一种。 5.根据权利要求1所述的一种基于图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 所述的步骤2.2)中, 所述的改进的Inception ‑GCN模型半监督分类算法为吸纳 过执行多个具有不同感知域的卷积, 并将不同滤波器的深度切片拼接到同一层中, 从而将 结果合并, 具体步骤为: 记感知域 为R的简单串联而成的图卷积网络为hR(X, A) 其中, 第一层的激活函数为ReLU, 第二层的激活函数为softmax, X为初始的图上节点的 特征矩阵, A为邻接矩阵, W(l)是每层独有的权重矩阵, 即要训练的矩阵, (l)表示这是第几 层的矩阵; 合并后Inception‑GCN: 其中∪R=1, 2, 3hR(..., A)表示接收相同输入的R个并行额分支, 各分支输出的拼接作为总 体输出。 6.根据权利要求1所述的一种基于图卷积神经网络和知识库的论文相关性分析方法,权 利 要 求 书 1/2 页 2 CN 114741519 A 2其特征在于, 所述的步骤三)中, 将论文集中的论文分区任务转化成图知识库上的社区发现 任务, 其具体步骤为: 步骤3.1), 利用伯努利 ‑泊松模型对图结构进行建模, 利用各节点的社区归属向量作 为 参数生成概 率分布, 作为节点邻接矩阵上的值; 步骤3.2), 利用图卷积神经网络模型对表示节点社区从属的向量和图上节点的邻接矩 阵以及属性向量进行建模, 生成社区从属矩阵; 步骤3.3), 根据社 区从属矩阵, 为每个节点输出从属关系向量, 将社区属性添加到论文 实体。 7.根据权利要求6所述的一种基于图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 所述的步骤3.1)中, 所述的参数生成概 率分布的生成方式为, 当给出从属关系 时, 邻接矩阵各项Auv为按这个式子的独立同分布采样: Auv ~Bernoulli(1‑exp(‑FuFvT)), 这个分布上参数 F的对数似然函数为: 经过平衡参数权 重, 即按照图上节点间是否相关, 进行加权处 理, 得所用的损失函数; 其中, F(l)为表示了节点 l的社区从属关系的行向量, 即的矩阵F的第l行。 8.根据权利要求6所述的一种基于图卷积神经网络和知识库的论文相关性分析方法, 其特征在于, 所述的步骤3.2)中, 所述的图卷积神经网络模型采用两层图卷积神经网络, 公式为: 其中每一层都是用ReLU作为激活函数, 减少运算量。 X表述输入, 表示图带有自边的临 界矩阵, W(l)是每层独有的权 重矩阵, 这 也就是要训练的矩阵, (l)表示 这是第几层的矩阵。 通过寻找合 适的神经网络参数θ, 得到最终的从属矩阵F: 权 利 要 求 书 2/2 页 3 CN 114741519 A 3

.PDF文档 专利 一种基于图卷积神经网络和知识库的论文相关性分析方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于图卷积神经网络和知识库的论文相关性分析方法 第 1 页 专利 一种基于图卷积神经网络和知识库的论文相关性分析方法 第 2 页 专利 一种基于图卷积神经网络和知识库的论文相关性分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:52:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。