安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210868117.6 (22)申请日 2022.07.22 (71)申请人 中国联合网络通信集团有限公司 地址 100033 北京市西城区金融大街21号 申请人 中讯邮电咨询设计院有限公司 (72)发明人 班瑞 马季春 王佳 华润多  张振超 汪云海 沈袁程 陈昕  (74)专利代理 机构 北京中博世 达专利商标代理 有限公司 1 1274 专利代理师 申健 (51)Int.Cl. G06F 40/253(2020.01) G06F 40/284(2020.01) G06F 40/289(2020.01) G06F 40/186(2020.01)G06F 9/445(2018.01) (54)发明名称 一种配置异常检测方法、 装置、 计算机设备 和存储介质 (57)摘要 本发明公开了一种配置异常检测方法、 装 置、 计算机设备和存储介质, 涉及计算机技术领 域, 解决了现有异常检测工作的人力成本较大的 问题。 该方法包括: 获取待检测的配置文件; 对各 配置文件进行词语提取, 得到各配置文件中的词 语; 确定各词语的词语属性; 基于预设规则、 各词 语以及各词语的词语属性, 分别构建各配置文件 对应的语 法分析树; 根据各配置文件对应的语 法 分析树, 对各配置文件进行异常检测, 得到配置 异常检测结果。 权利要求书3页 说明书18页 附图9页 CN 115204155 A 2022.10.18 CN 115204155 A 1.一种配置异常检测方法, 其特 征在于, 包括: 获取待检测的配置文件; 对各所述配置文件进行词语提取, 得到各 所述配置文件中的词语; 确定各所述词语的词语属性; 基于预设规则、 各所述词语以及各所述词语的词语属性, 分别构建各所述配置文件对 应的语法分析树; 根据各所述配置文件对应的语法分析树, 对各所述配置文件进行异常检测, 得到配置 异常检测结果。 2.根据权利要求1所述的方法, 其特征在于, 在所述确定各所述词语的词语属性之前, 还包括: 从各所述词语中筛 选出不属于预设格式的目标词语; 其中, 所述确定各 所述词语的词语属性, 包括: 确定各 所述目标词语的词语属性。 3.根据权利要求2所述的方法, 其特征在于, 所述目标词语的词语属性包括: 所述目标 词语在所述配置文件中的连续重复次数、 词语 类型; 其中, 所述确定各 所述目标词语的词语属性, 包括: 统计各所述目标词语在所述配置文件中的连续重复次数、 出现频率; 根据所述出现频率确定所述配置文件中的各 所述目标词语对应的词语 类型。 4.根据权利要求3所述的方法, 其特 征在于, 所述出现频率包括词频和文档频率; 其中, 所述根据所述出现频率确定所述配置文件中的各所述目标词语对应的词语类 型, 包括: 若所述目标词语中的第 一词语满足预设条件, 则确定所述第 一词语的词语类型为关键 字类型; 所述预设条件包括所述词语的所述词 频大于第一阈值、 且所述文档频率大于第二 阈值; 若所述目标词语中的第 二词语不满足所述预设条件, 则确定所述第 二词语的词语类型 为普通类型。 5.根据权利要求2 ‑4中任意一项所述的方法, 其特征在于, 所述基于预设规则、 各所述 词语以及各 所述词语的词语属性, 分别构建各 所述配置文件 对应的语法分析树, 包括: 针对任一所述配置文件: 将所述配置文件的文件标识存 储在所述语法分析树的第一层节点; 根据所述目标词语创建词节点, 将所述目标词语的词语 内容和所述词语属性存储在所 述词节点; 按照各所述目标词语在所述配置文件中的出现顺序, 对属于同一句子的各所述词节点 串接, 得到句子节点; 对属于同一段落的各 所述句子节点按照出现顺序串接, 得到段落节点; 分别统计各 所述句子节点、 所述段落节点的连续重复次数; 将所述段落节点、 所述段落节点的连续重复次数存储在所述语法分析树的第二层节 点; 根据各所述句子节点在所述配置文件中所属的段落, 将各所述句子节点分别连接在所 述句子节点对应的所述段落节点, 与所述句子节点的连续重复次数共同存储为所述语法分权 利 要 求 书 1/3 页 2 CN 115204155 A 2析树的第三层节点; 根据各所述目标词语在所述配置文件中所属的句子, 将各所述词节点分别连接在所述 词节点对应的所述句子节点, 作为所述语法分析树的第四层节点。 6.根据权利要求1所述的方法, 其特征在于, 所述配置异常检测结果包括: 所述配置文 件中出现异常的异常配置文件, 所述异常配置文件中的异常位置, 以及所述异常位置对应 的异常类型; 其中, 所述根据 各所述配置文件对应的语法分析树, 对各所述配置文件进行异常检测, 得到配置异常检测结果, 包括: 通过对各所述配置文件对应的所述语法分析树进行聚类, 确定各所述配置文件中的所 述异常配置文件; 比较配置文件模板与所述异常配置文件, 确定所述异常配置文件的异常位置; 所述配 置文件模板与所述异常配置文件属于同一种类; 将所述异常配置文件的异常位置的文件内容与 预设异常类型进行匹配, 得到所述异常 位置的文件内容对应的异常类型。 7.根据权利要求6所述的方法, 其特征在于, 在所述对各所述配置文件进行词语提取, 得到各所述配置文件中的词语之后, 在所述根据各所述配置文件对应的语法分析树, 对各 所述配置文件进行异常检测, 得到配置异常检测结果之前, 所述方法还 包括: 从所述配置文件中随机选取两组以上相邻的语料样本; 其中, 所述语料样本包括段落、 句子和词语中的至少一项; 统计所述配置文件中的相邻语料组合的共现频率; 所述相邻 语料组合由相邻的同一种 所述语料样本组成; 计算所述配置文件中同一种所述语料样本之间的相似度; 根据所述相邻语料组合的共现频率、 同一种所述语料样本之间的相似度, 确定所述配 置文件的候选异常类型; 根据所述 候选异常类型发出提 示信息, 并获取用户针对所述 提示信息的反馈信息; 将所述反馈信息中确定的目标候选异常类型作为所述配置文件的所述预设异常类型。 8.根据权利要求6或7所述的方法, 其特征在于, 所述通过对各所述配置文件对应的所 述语法分析树进行聚类, 确定各 所述配置文件中的所述异常配置文件, 包括: 采用K均值聚类算法对各 所述语法分析树进行聚类, 得到聚类结果; 获取所述聚类结果中的异常数据点; 其中, 所述异常配置文件包括所述异常数据点对 应的配置文件。 9.根据权利要求8所述的方法, 其特征在于, 所述采用K均值聚类算法对各所述语法分 析树进行聚类, 得到聚类结果, 包括: 根据所述语法分析树, 分别确定每一个所述配置文件中包括的段落种类数量、 句子种 类数量以及词语种类数量; 基于每一个所述配置文件的所述段落种类数量、 句子种类数量以及词语种类数量, 生 成各所述语法分析树对应的数组; 采用K均值聚类算法对各 所述语法分析树对应的数组进行聚类, 得到所述聚类结果。 10.根据权利要求8所述的方法, 其特征在于, 所述K均值聚类算法中的K值的确定过程权 利 要 求 书 2/3 页 3 CN 115204155 A 3

.PDF文档 专利 一种配置异常检测方法、装置、计算机设备和存储介质

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种配置异常检测方法、装置、计算机设备和存储介质 第 1 页 专利 一种配置异常检测方法、装置、计算机设备和存储介质 第 2 页 专利 一种配置异常检测方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:34:17上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。