(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210914301.X
(22)申请日 2022.08.01
(65)同一申请的已公布的文献号
申请公布号 CN 114968246 A
(43)申请公布日 2022.08.30
(73)专利权人 深圳市明源云科技有限公司
地址 518000 广东省深圳市南 山区粤海街
道高新区社区高新南十道16号金地威
新中心A座801
(72)发明人 梁伟 吴云霞
(74)专利代理 机构 深圳市世纪恒程知识产权代
理事务所 4 4287
专利代理师 廖永耀
(51)Int.Cl.
G06F 8/38(2018.01)G06F 9/445(2018.01)
G06F 9/451(2018.01)
(56)对比文件
CN 112114914 A,2020.12.2 2
US 2011107252 A1,201 1.05.05
CN 114816374 A,202 2.07.29
陈茜 等.一种大 数据分析组件的自动化 开
发集成方法. 《计算机 应用与软件》 .2016,第3 3卷
(第7期),第3 3-37页.
审查员 张雁琳
(54)发明名称
数据分析 组件生成方法、 设备及计算机可读
存储介质
(57)摘要
本发明公开了一种数据分析 组件生成方法、
设备及计算机可读存储介质, 涉及数据分析技术
领域, 所述数据分析组件生成方法包括: 输出各
预设分析算法的功能提示信息, 其中, 所述功能
提示信息包括各所述预设分析算法的分析功能
以及各所述预设分析算法的参数配置标准; 根据
用户基于所述功能提示信息进行的选择操作确
定目标分析算法, 根据用户基于所述目标分析算
法的参数配置标准的配置操作得到参数配置信
息; 基于所述目标分析算法和所述参数配置信息
生成目标数据分析组件。 本发明可满足大量不同
分析场景的分析结论的制作。 同时, 也降低了数
据分析中分析算法的使用门槛, 使得非专业人员
也可使用分析算法对数据进行分析。
权利要求书2页 说明书11页 附图7页
CN 114968246 B
2022.11.29
CN 114968246 B
1.一种数据分析组件生成方法, 其特征在于, 所述数据分析组件生成方法包括以下步
骤:
输出各预设分析算法的功能提示信息, 其中, 所述功能提示信息包括各所述预设分析
算法的分析功能以及各 所述预设 分析算法的参数配置标准;
根据用户基于所述功能提示信 息进行的选择操作确定目标分析算法, 根据用户基于所
述目标分析算法的参数配置标准的配置操作得到参数配置信息;
基于所述目标分析算法和所述 参数配置信息生成目标 数据分析组件;
其中, 在所述输出 各预设分析算法的功能提 示信息的步骤之前, 所述方法还 包括:
接收待分析数据, 基于与 所述待分析数据对应的目标业务指标从历史分析记录 中匹配
数据分析组件生成相关数据分析组件;
基于所述相关数据分析组件生成数据分析组件推荐列表;
输出数据分析组件推荐列表, 以使用户基于所述数据分析组件推荐列表进行所述目标
数据分析组件的选择;
其中, 在所述基于与 所述待分析数据对应的目标业务指标从历史分析记录 中匹配数据
分析组件生成相关数据分析组件的步骤之后, 所述方法包括:
若匹配到的所述相关数据分析组件的数量小于预设数量, 则 基于所述目标业务指标生
成数据画像;
基于所述数据画像从预设业 务指标库中匹配与所述数据画像相似的相似业 务指标;
基于所述相似业务指标从所述历史分析记录中匹配数据分析组件生成新的所述相关
数据分析组件;
执行所述基于所述相关数据分析组件生成数据分析组件推荐列表的步骤。
2.如权利要求1所述的数据分析组件生成方法, 其特征在于, 在所述基于所述目标分析
算法和所述 参数配置信息生成目标 数据分析组件的步骤之前, 所述方法包括:
基于所述目标分析算法和所述 参数配置信息生成并输出 数据分析 结果预览画面;
当接收到根据用户基于所述数据分析结果预览画面的确认操作生成的结果确认指令
后, 执行所述基于所述目标分析算法和所述 参数配置信息生成目标 数据分析组件的步骤。
3.如权利要求1所述的数据分析组件生成方法, 其特征在于, 所述基于所述相关数据分
析组件生成数据分析组件推荐列表的步骤 包括:
获取所述相关数据分析组件的历史使用记录;
基于所述历史使用记录生成对应所述相关数据分析组件的评分;
根据各所述相关数据分析组件的评分排名生成所述数据分析组件推荐列表。
4.如权利要求3所述的数据分析组件生成方法, 其特征在于, 所述历史使用记录包括所
述相关数据分析组件的配置次数、 所述相关数据分析组件的调用次数和所述相关数据分析
组件的用户影响数, 所述基于所述历史使用记录生成对应所述相关数据分析组件的总评分
的步骤包括:
将所述配置次数、 调用次数和用户影响数输入至预设评分公式生成所述相关数据分析
组件的评分;
所述预设评分公式为:权 利 要 求 书 1/2 页
2
CN 114968246 B
2其中, Nmin为各相 关数据分析组件的被配置次数中最小的配置次数、 Nmax为各相关数
据分析组件的被配置次数中最大的配置次数、 M min为各相关数据分析组件的被调用次数中
最小的调用次数、 Mmax为各相关数据分析组件的被调用次数中最大的调用次数、 Fmin为各
相关数据分析 组件的影响客户数中最小的影响客户数、 Fmax为各相关数据分析组件的影响
客户数中最大的影响客户数、 A为配置次数的权重系数、 B为调用次数的权重系数、 C为影响
客户数的权 重系数。
5.如权利要求1所述的数据分析组件生成方法, 其特征在于, 所述数据画像包括目标业
务指标的第一数据源表名称、 所述 目标业务指标的第一数据源字段名称、 所述目标业务指
标的第一基本属性和所述目标业务指标的第一名称属性, 所述基于所述数据画像从预设业
务指标库中匹配与所述数据画像相似的相似业 务指标的步骤 包括:
从所述预设业 务指标库中获取现存业 务指标;
将所述第一数据源表名称与所述现存业务指标的第二数据源表名称进行相似度比较
生成第一匹配度;
将所述第一数据源字段名称与所述现存业务指标的第二数据源字段名称进行相似度
比较生成第二匹配度;
将所述第一基本属性与所述现存业务指标的第二基本属性进行相似度比较生成第三
匹配度;
将所述第一名称属性与所述现存业务指标的第二名称属性进行相似度比较生成第四
匹配度;
将所述第一匹配度、 第二匹配度、 第三匹配度和第 四匹配度的乘积作为所述现存业务
指标的综合匹配度;
遍历所述预设业务指标库中的所述现存业务指标, 生成各所述现存业务指标的综合匹
配度;
将所述综合匹配度大于预设匹配度的现存业 务指标作为所述相似业 务指标。
6.如权利要求5所述的数据分析组件生成方法, 其特征在于, 所述数据画像还包括所述
目标业务指标的数据结构类型, 在所述基于所述数据画像从预设指标库中匹配与所述数据
画像相似的相似业 务指标的步骤之后, 所述方法包括:
若未匹配到所述相似业务指标, 则基于所述数据 结构类型对预设数据分析组件库进行
过滤, 得到数据标准与所述数据结构类型相同的待推荐数据分析组件;
基于所述待推荐数据分析组件生成所述数据分析组件推荐列表。
7.一种数据分析组件生成设备, 其特征在于, 所述数据分析组件生成设备包括: 存储
器、 处理器及存储在所述存储器上并可在所述处理器上运行 的数据分析组件生成程序, 所
述数据分析组件生成程序被所述处理器执行时实现如权利要求1至6中任一项所述的数据
分析组件生成方法的步骤。
8.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有数据分
析组件生成程序, 所述数据分析组件生成程序被处理器执行时实现如权利要求 1至6中任一
项所述的数据分析组件生成方法的步骤。权 利 要 求 书 2/2 页
3
CN 114968246 B
3
专利 数据分析组件生成方法、设备及计算机可读存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:50:49上传分享