安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210092059.2 (22)申请日 2022.01.26 (71)申请人 浙江绿城未来数智科技有限公司 地址 311100 浙江省杭州市余杭区鼎创财 富中心2幢10层1 101室 (72)发明人 陈一萌 陈霄 许闻楷 沈鸿杰 陈炬均 (74)专利代理 机构 合肥市科融知识产权代理事 务所(普通 合伙) 34126 专利代理师 吴伟栋 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/25(2019.01) G06F 16/215(2019.01) G06Q 50/26(2012.01) (54)发明名称 一种应用于 基层治理的人口数据治理方法 (57)摘要 本发明公开了一种应用于基层治理的人口 数据治理方法, 属于数据治理技术领域。 一种应 用于基层 治理的人口数据治理方法, 包括以下步 骤: S1、 获取多种来源的人口核心数据和基础数 据, 对多源人口数据汇聚; S2、 数据过滤, 对获取 数据的质量进行评估、 过滤; S3、 将身份证信息作 为人口唯一标识ID, 建立人口档案; S4、 构建数据 治理任务, 对数据中脏数据、 重复数据、 零散 数据 进行治理; S5、 在对数据进行清洗、 去重、 关联和 合并后, 针对异常数据和缺失数据进行治理; S6、 对已经完成治理的数据进行数据自动落库; 可以 解决多源数据环境下小区人口数据重复、 数据 异 常、 数据缺失的问题, 克服人工数据治理的效率 低、 成本高、 准确性差的问题。 权利要求书2页 说明书4页 附图2页 CN 114595236 A 2022.06.07 CN 114595236 A 1.一种应用于基层治理的人口数据治理方法, 其特 征在于: 包括以下步骤: S1、 获取多种来源的人口核心数据和基础数据, 对多源人口数据汇聚; S2、 数据过滤, 对获取数据的质量进行评估、 过滤, 最大限度保留数据的完整性, 对于记 录缺失的数据、 逻辑上完全不 合理或相互矛盾的数据、 乱码数据进行自动过 滤删除; S3、 将身份 证信息作为人口唯一标识ID, 建立人口档案; S4、 构建数据治理任务, 对数据中脏数据、 重复数据、 零散数据进行治理, 先判断人口信 息数据库中数据身份证相同情况, 再判断人 口信息数据库中数据手机号相同情况, 在上述 基础上对数据进行一系列清洗、 去重、 关联和合并动作; S5、 在对数据进行清洗、 去重、 关联和合并后, 针对异常数据和缺失数据进行治理; S6、 对已经完成治理的数据进行 数据自动落库。 2.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 人口 核心数据包括人口姓名、 身份证号和手机号; 基础数据包括家庭住址、 政治面貌、 婚姻状况、 宗教信仰、 工作情况和个人照片。 3.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 对异 常数据和缺 失数据进 行治理的方式为通过S4筛选出异常数据和缺 失数据, 并同步提示到人 口信息数据库。 4.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 异常 数据包括 姓名异常、 身份 证号异常和手机号异常; 在S4中进行 数据治理时同一条 人口数据存在两个以上姓名, 视为 姓名异常; 在S4中进行 数据治理时身份 证格式存在错 误, 视为身份 证异常; 在S4中进行 数据治理时同一条手机号对应不同的身份 证, 视为手机号异常。 5.根据权利要求1所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 缺失 数据包括身份 证号缺失、 手机号 缺失和人口信息关键 字段缺失; 在S4中进行 数据治理时无身份 证的人口数据, 视为身份 证号缺失; 在S4中进行 数据治理时无手机号的人口数据视为手机号 缺失; 在S4中进行数据治理时人口出生日期、 性别和年龄字段缺失视为人口信息关键字段缺 失。 6.根据权利要求5所述的一种应用于基层治理 的人口数据治理方法, 其特征在于: 对于 人口信息关键字段缺 失, 人口信息数据库可根据已有的身份证号自动判断该人口的出生日 期、 性别和年龄, 并进行信息的自动填充。 7.根据权利要求4所述的一种应用于基层治理的人口数据治理方法, 其特征在于: S4、 S5中对数据进行治理的逻辑判断步骤具体为: 判断人口数据I中是否有 身份证: A、 人口数据I中有身份证, 判断数据库中是否有和人口数据I中相同身份证号的人口数 据II; A1、 有相同的身份 证号, 则将I和I I的人口数据合并; A2、 无相同的身份证号, 则判断数据库中是否具有和人口数据I中相同手机号的人口数 据III; A21、 有相同的手机号, 则将I和III的人口数据 合并, I和III的身份证信息同时保留, 且权 利 要 求 书 1/2 页 2 CN 114595236 A 2生成“身份证号异常 ”事件告警, 形成提醒该条人口信息中的身份证字段数据异常信息, 需 进行核查确认; A22、 无相同手机号, 则数据库生成一条新增人口数据档案; B、 人口数据I中无身份证, 则判断数据库中是否具有和人口数据I中相同手机号的人口 数据IV; B1、 有相同的手机号, 判断I和IV中姓名字段 是否一致; B11、 姓名一 致, 将I和IV的人口数据进行合并; B12、 姓名不一致, 将I和IV的人口数据 合并, I和IV的姓名同时保留, 且生成 “姓名异常 ” 事件告警, 形成提醒 该条人口信息中的姓名字段 数据异常信息, 需进行核查确认; B2、 无相同的手机号, 数据库自动生成虚拟身份 证号且生成一条新增人口数据档案 。权 利 要 求 书 2/2 页 3 CN 114595236 A 3
专利 一种应用于基层治理的人口数据治理方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 11:14:32
上传分享
举报
下载
原文档
(381.5 KB)
分享
友情链接
思度安全-DSMM-002 岗位职责说明书V1.0.pdf
GA-T 1714-2020 信息安全技术 异常流量检测和清洗产品安全技术要求.pdf
ISO27002-2022中文版.pdf
GB-T 26837-2011 无损检测仪器 固定式和移动式工业X射线探伤机.pdf
GB-T 27977-2022 水泥生产电能能效测试及计算方法.pdf
GB-T 24353-2022 风险管理指南 .pdf
DB4403-T 51-2020 珠宝行业经营服务规范 深圳市.pdf
GB-T 39842-2021 集成电路 IC 卡封装框架.pdf
DB42-T 1833-2022 河道管理范围钻孔封孔技术规程 湖北省.pdf
DB14-T 2987—2024 山西电子政务外网电子认证系统总体架构 山西省.pdf
GB-T 36412-2018 力标准机的检验与校准.pdf
GB-T 37580-2019 聚乙烯 PE 埋地燃气管道腐蚀控制工程全生命周期要求.pdf
项目跟踪器.xltx
YD-T 3763.3-2021 研发运营一体化(DevOps)能力成熟度模型 第3部分:持续交付.pdf
GB-T 17393-2008 覆盖奥氏体不锈钢用绝热材料规范.pdf
T-ZSFX 002—2019 中山装手工制作生产规范.pdf
GB-T 8566-2022系统与软件工程 软件生存周期过程.pdf
T-FSI 090—2022 低挥发性甲基环硅氧烷的107胶.pdf
GB-T 34532-2017 焦化废水 氨氮含量的测定 甲醛法.pdf
GB-T 21898-2008 纺织品颜色表示方法.pdf
1
/
3
9
评价文档
赞助2.5元 点击下载(381.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。