(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210395173.2
(22)申请日 2022.04.15
(71)申请人 华南理工大 学
地址 510640 广东省广州市天河区五山路
381号
(72)发明人 詹志辉 高敏 陈春华 张军
(74)专利代理 机构 广州市华学知识产权代理有
限公司 4 4245
专利代理师 黄卫萍
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9536(2019.01)
G06Q 50/00(2012.01)
G06F 16/36(2019.01)
(54)发明名称
一种基于多任务学习和知识图谱增强的项
目推荐方法
(57)摘要
本发明公开了一种基于多任务学习和知识
图谱增强的项目推荐方法, 其中, 项目包括图书、
电影、 音乐、 商品。 相较于传统的项目推荐方法,
本发明引入知识图谱, 缓解了数据稀疏、 精度不
高等问题。 本发明设计一个推荐模型EMKR, 它使
用一种多任务学习共享单元关联推荐模块和知
识图谱嵌入模块。 在推荐模块中, 使用两部分建
模策略, 用注意力机制捕捉用户行为模式, 并引
入辅助向量扩展用户和项目的潜在 表达能力; 在
知识图谱嵌入模块, 区分了不同关系的重要性,
使用图卷积网络挖掘知识 图谱丰富的多关系语
义。 最后, 交替训练EM KR, 使用训练好的模型进行
推荐。 本发 明公开的项目推荐方法具有较好的性
能, 尤其在稀疏的推荐场景 下, 效果显著提升 。
权利要求书4页 说明书8页 附图2页
CN 114817712 A
2022.07.29
CN 114817712 A
1.一种基于多任务学习和知识图谱增强的项目推荐方法, 其中, 所述项目包括图书、 电
影、 音乐、 商品, 其特 征在于, 所述项目推荐方法包括以下步骤:
S1、 数据准备: 获取用户评分项目的历史记录, 构造用户项目的隐式反馈矩阵
其中M是用户的个数, N是项目的个数, 索引号为m, 的用户对索引号为n的项目有
正向的偏好, m=0,1, …,M‑1, n=0,1, …,N‑1, 则矩阵Y的第m行、 第n列数值为1, 否则为0; 同
时, 构造知识图谱G={(head,relation,tail)|head,tail∈E,relation∈R}, 知识图谱的
基本单位是三元组(head,relation,tail), 其中, head是头实体, tail是尾实体, relation
是头实体指向尾实体的关系, E是头实体和尾实体构成的实体集合, 实体集合E大小为P, R是
关系集合, 关系集 合R的大小为 Q;
S2、 使用交替训练的方式训练推荐模型, 推荐模型简称为EMKR; 其中, 所述EMKR包括推
荐模块、 知识图谱嵌入模块和L个多任务学习共享单元, 简称SU; 其中, 所述推荐模块包含顺
序连接的L个特征提取层和一个预测层, 第l个特征提 取层简称为RSLayerl, 其中, l=0,1, …,
L‑1; 所述知识图谱嵌入模块包含顺序连接的L个特征提取层和一个预测层, 第l个特征提取
层简称为KGLayer l; SU关联RSLayer l和KGLayer l, 实现两个相关向量的特 征共享;
S3、 使用训练好的EMKR预测用户 ‑项目对的得分, 根据得分返回用户的推荐列表, 具体
如下: 给定一个用户, 计算给定用户对所有项目的得分, 将分值按照 从大到小排序, 排位越
靠前的越应该优先推荐给用户。
2.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特
征在于, 所述 步骤S2中, E MKR的推荐模块执 行一种
两部分建模策略, 所述两部分建模策略首先为索引号为m的用户初始两个d维向量
为索引号为n的项目初始两个d维向量
其中,
是该用户在RSLayer 0的上下文向量, 用于捕捉用户的历史行为,
是该用户在RSLayer 0的辅助向量, 用于扩展用户的表达能力;
该项
目在RSLayer 0的上下文向量, 用于捕捉知识图谱中的有用信息,
是该项目在
RSLayer0的辅助向量, 用于扩展项目的表达能力;
其中,
是该用户在RSLayer l的完整向量,
是该项目
在RSLayer l的完整向量。
3.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特
征 在 于 , 所 述 步 骤 S 2中 , 将 两 部 分 建 模 策略 应 用到 所 有 特 征 提 取 层中 , 即
其中
是索引号
为m的用户在RSLayer l的完整向量,
是索引号 为n的项目在RSLayer l的完整向量。
4.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特
征在于, 所述步骤S2中, 每一个项目都与知识图谱中相应的头实体对应, 并且EMKR统一了项
目和相应头实体的索引号, 即索引号 为n的项目对应知识图谱中索引号 为n的头实体。
5.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特
征在于, 所述步骤S2中, 为G中的头实体、 关系、 尾实体初始一个d维向量表示, 分别记为
其中,
是索引号为i的头实体在KGLayer 0的初始向量,
是索引号为o权 利 要 求 书 1/4 页
2
CN 114817712 A
2的关系在KGLayer 0的初始向量、
是索引号为j的尾实体在KGLayer 0初始向量, i=0,1, …,
P‑1, o=0,1,…,Q‑1, j=0,1, …,P‑1。
6.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特
征在于, 所述 步骤S2中, 推荐模块的RSLayerl的计算过程如下:
首先, 采样索引号为m的用户的cnt个历史点击项目, 设该用户的历史点击项目的索引
号为index_k, k=0,1, …cnt‑1, index_k∈{0,1, …,N‑1}; 然后, 使用注意力机制得到该用
户在RSLayerl+1的上下文向量, 注意力机制的计算公式如下:
其中, βk是第k个历史点击项目的注意力得分, Wβ是用于计算注意力得分的一个可训练
的参数矩阵,
是索引号为index_k的项目在Layer l的完整向量, αk是使用公式(2)计
算的归一化注意力得分, αk取值的范围是(0 ,1); 当l=L ‑1时, 公式(3)得到向量
是推荐模块的特征提取层输出的索引号为m的项目的上下文向
量。
7.根据权利要求1所述的一种基于多任务学习和知识图谱增强的项目推荐方法, 其特
征在于, 所述步骤S2中, EMKR的知识图谱嵌入模块的KGLayerl使用神经网络中的全连接FC()
提取关系的潜在特 征, 计算方式如下:
其中,
是索引号为o的关系在KGLayerl的向量,
是该关系在KGLayerl+1的向量, W、 b
分别是用于实现全连接的参数矩阵和 偏置向量, 由模型训练更新, ReLU()是用于实现全连
接的激活函数; 当l=L ‑1时, 公式(4)得到向量
是知识图谱嵌入模块的特征提取层
输出的索引号 为o的关系向量;
同时, EMKR的知识图谱嵌入模块的KGLayer l使用Hop个图卷积网络层计算头实体的邻域
向量; 令hop=0,1, …Hop‑1, 第hop个图卷积网络层的计算过程如下:
首先, 采样索引号为i的头实体的Ns个邻域三元组, Ns个邻域三元组中, 邻域尾实体的
索引号为tail_s, 邻域关系的索引号为rel_s, s=0,1,...,Ns ‑1, tail_s∈{0,1, …,P‑1},
rel_s∈{0,1, …,Q‑1}, 使用公式(5)计算第s个邻域关系对该头实体的重要性
其中,
是索引号 为rel_s的关系在KGLayer l的向量;
然后, 使用公式(6)计算归一 化重要性
取值的范围是(0,1):权 利 要 求 书 2/4 页
3
CN 114817712 A
3
专利 一种基于多任务学习和知识图谱增强的项目推荐方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:52:16上传分享