安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210092059.2 (22)申请日 2022.01.26 (71)申请人 浙江绿城未来数智科技有限公司 地址 311100 浙江省杭州市余杭区鼎创财 富中心2幢10层1 101室 (72)发明人 陈一萌 陈霄 许闻楷 沈鸿杰  陈炬均  (74)专利代理 机构 合肥市科融知识产权代理事 务所(普通 合伙) 34126 专利代理师 吴伟栋 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/25(2019.01) G06F 16/215(2019.01) G06Q 50/26(2012.01) (54)发明名称 一种应用于 基层治理的人口数据治理方法 (57)摘要 本发明公开了一种应用于基层治理的人口 数据治理方法, 属于数据治理技术领域。 一种应 用于基层 治理的人口数据治理方法, 包括以下步 骤: S1、 获取多种来源的人口核心数据和基础数 据, 对多源人口数据汇聚; S2、 数据过滤, 对获取 数据的质量进行评估、 过滤; S3、 将身份证信息作 为人口唯一标识ID, 建立人口档案; S4、 构建数据 治理任务, 对数据中脏数据、 重复数据、 零散 数据 进行治理; S5、 在对数据进行清洗、 去重、 关联和 合并后, 针对异常数据和缺失数据进行治理; S6、 对已经完成治理的数据进行数据自动落库; 可以 解决多源数据环境下小区人口数据重复、 数据 异 常、 数据缺失的问题, 克服人工数据治理的效率 低、 成本高、 准确性差的问题。 权利要求书2页 说明书4页 附图2页 CN 114595236 A 2022.06.07 CN 114595236 A 1.一种应用于基层治理的人口数据治理方法, 其特 征在于: 包括以下步骤: S1、 获取多种来源的人口核心数据和基础数据, 对多源人口数据汇聚; S2、 数据过滤, 对获取数据的质量进行评估、 过滤, 最大限度保留数据的完整性, 对于记 录缺失的数据、 逻辑上完全不 合理或相互矛盾的数据、 乱码数据进行自动过 滤删除; S3、 将身份 证信息作为人口唯一标识ID, 建立人口档案; S4、 构建数据治理任务, 对数据中脏数据、 重复数据、 零散数据进行治理, 先判断人口信 息数据库中数据身份证相同情况, 再判断人 口信息数据库中数据手机号相同情况, 在上述 基础上对数据进行一系列清洗、 去重、 关联和合并动作; S5、 在对数据进行清洗、 去重、 关联和合并后, 针对异常数据和缺失数据进行治理; S6、 对已经完成治理的数据进行 数据自动落库。 2.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 人口 核心数据包括人口姓名、 身份证号和手机号; 基础数据包括家庭住址、 政治面貌、 婚姻状况、 宗教信仰、 工作情况和个人照片。 3.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 对异 常数据和缺 失数据进 行治理的方式为通过S4筛选出异常数据和缺 失数据, 并同步提示到人 口信息数据库。 4.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 异常 数据包括 姓名异常、 身份 证号异常和手机号异常; 在S4中进行 数据治理时同一条 人口数据存在两个以上姓名, 视为 姓名异常; 在S4中进行 数据治理时身份 证格式存在错 误, 视为身份 证异常; 在S4中进行 数据治理时同一条手机号对应不同的身份 证, 视为手机号异常。 5.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 缺失 数据包括身份 证号缺失、 手机号 缺失和人口信息关键 字段缺失; 在S4中进行 数据治理时无身份 证的人口数据, 视为身份 证号缺失; 在S4中进行 数据治理时无手机号的人口数据视为手机号 缺失; 在S4中进行数据治理时人口出生日期、 性别和年龄字段缺失视为人口信息关键字段缺 失。 6.根据权利要求5所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 对于 人口信息关键字段缺 失, 人口信息数据库可根据已有的身份证号自动判断该人口的出生日 期、 性别和年龄, 并进行信息的自动填充。 7.根据权利要求4所述的一种应用于基层治理的人口数据治理方法, 其特征在于: S4、 S5中对数据进行治理的逻辑判断步骤具体为: 判断人口数据I中是否有 身份证: A、 人口数据I中有身份证, 判断数据库中是否有和人口数据I中相同身份证号的人口数 据II; A1、 有相同的身份 证号, 则将I和I I的人口数据合并; A2、 无相同的身份证号, 则判断数据库中是否具有和人口数据I中相同手机号的人口数 据III; A21、 有相同的手机号, 则将I和III的人口数据 合并, I和III的身份证信息同时保留, 且权 利 要 求 书 1/2 页 2 CN 114595236 A 2生成“身份证号异常 ”事件告警, 形成提醒该条人口信息中的身份证字段数据异常信息, 需 进行核查确认; A22、 无相同手机号, 则数据库生成一条新增人口数据档案; B、 人口数据I中无身份证, 则判断数据库中是否具有和人口数据I中相同手机号的人口 数据IV; B1、 有相同的手机号, 判断I和IV中姓名字段 是否一致; B11、 姓名一 致, 将I和IV的人口数据进行合并; B12、 姓名不一致, 将I和IV的人口数据 合并, I和IV的姓名同时保留, 且生成 “姓名异常 ” 事件告警, 形成提醒 该条人口信息中的姓名字段 数据异常信息, 需进行核查确认; B2、 无相同的手机号, 数据库自动生成虚拟身份 证号且生成一条新增人口数据档案 。权 利 要 求 书 2/2 页 3 CN 114595236 A 3

.PDF文档 专利 一种应用于基层治理的人口数据治理方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种应用于基层治理的人口数据治理方法 第 1 页 专利 一种应用于基层治理的人口数据治理方法 第 2 页 专利 一种应用于基层治理的人口数据治理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:14:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。