(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210808386.3
(22)申请日 2022.07.08
(71)申请人 武汉众邦银行股份有限公司
地址 432200 湖北省武汉市黄陂区盘龙城
经济开发区汉口北大道88号汉口北国
际商品交易中心D2区1-2层、 2 2-23层
(72)发明人 李奔 程峰 李耀 彭磊 杨志文
(74)专利代理 机构 成都正煜知识产权代理事务
所(普通合伙) 51312
专利代理师 袁宇霞
(51)Int.Cl.
G06F 40/166(2020.01)
G06F 40/186(2020.01)
G06F 9/445(2018.01)
(54)发明名称
一种大数据pdf参数化配 置导出方法
(57)摘要
本发明涉及数据处理技术领域, 提供了一种
大数据pdf参数化配置导出方法, 目的在于解决
大数据情况下pdf生成的时间过长, 文件 过大, 卡
顿的问题。 主要方案包括将要生成的pdf模板样
式, 转换成xml配置文件, 读取xml配置文件, 获取
pdf配置信息, 得到pdf文件属性、 page基础属性、
fonts属性, page ‑all属性, page ‑data属性; 并根
据pdf文件属性中的size参数, 获取的数据结果
的记录总数, 计算PDF文件个 数N, For循环N, 创建
单个PDF填充对象, 从数据库数据查询到的指定
记录条数待填充的业务数据, 组装pdf文件中的
每页属性; 根据获取的pdf配置信息及获取的业
务数据, 生成pdf文 件。
权利要求书3页 说明书11页
CN 115186634 A
2022.10.14
CN 115186634 A
1.一种大 数据pdf参数化配置导出 方法, 其特 征在于, 包括以下步骤:
步骤1: 将要生成的pdf模板样式, 转换成xml配置文件;
步骤2: 通过Digester方法读取步骤1定义 的xml配置文件, 获取pdf配置信息, 得到pdf
文件属性、 pa ge基础属性、 fo nts属性, pa ge‑all属性, pa ge‑data属性;
步骤3: 根据步骤2获取的page ‑all属性、 page ‑data属性、 pdf文件属性, 根据pdf文件属
性中的size参数, 获取的数据结果的记录总数, 计算PDF文件个数N, For循环N, 创建单个PDF
填充对象, 从数据库数据查询到的指 定记录条数待填充的业务数据, 组装pdf文件中的每页
属性;
步骤4: 根据步骤2获取的pdf配置信息及步骤3获取的业务数据, 一一生成pdf文件, 并
压缩。
2.根据权利要求1所述的一种大数据pdf参数化配置导出方法, 其特征在于, 步骤1包括
如下步骤:
步骤1.1: 将pdf模板样式中的文件属性, 转换为pdf文件标签属性, 文件属性包括文件
名称、 路径、 每 个文件大小size;
步骤1.2: 将pdf模板样式 中的page基础属性, 转换为pa ge标签属性;
步骤1.3: 将pdf模板样式 中的fonts属性, 转换为fo nts标签属性;
步骤1.4: 将pdf模板样式 中的page‑all属性, 转换为pa ge‑all标签属性;
步骤1.5: 将pdf模板样式中 的page‑data属性, 转换为page ‑data标签属性, 得到最终的
xml配置文件。
3.根据权利要求1所述的一种大数据pdf参数化配置导出方法, 其特征在于, 步骤2包括
如下步骤:
2.1: 根据定义唯一pdf文件配置的标识ID从xml配置文件获取pdf配置信息, pdf配置信
息包括pdf文件属性、 fo nts属性、 pa ge‑all属性、 pa ge‑data属性、 pa ge基础属性;
Pdf文件属性: 包括 导出文件名称、 文件路径、 每 个文件大小size、 是否 压缩;
page基础属性: 包括pdf布局方向layout、 页眉header、 页 脚footer;
fonts属性包括: 包括字体类型集font ‑types, 字体类型包括: 宋体、 黑体、 微软雅黑, 字
体样式集fo nt‑styles, 字体样式包括: 字体大小、 加粗标志、 颜色;
page‑all属性, 即pdf文件每页均填充的固定区域, 为重复展示数据, 包括:
文本域text ‑areas: 文本字体font ‑type、 字体样式font ‑style、 文本悬浮位置text ‑
align、 文本行间距border、 文本 宽度width、 填充值 key‑value、 文本值;
表格域table ‑areas: 字体类型font ‑type、 字体样式font ‑style、 文本块水平
xAlignment、 垂直 位置yAlignment、 单 元格宽度w idth、 单元格填充属性 key‑value、 文本值;
page‑data属性, 即pdf文件数据区域, 包括:
表格域table ‑areas: 文本字体类型font ‑type、 字体样式font ‑style、 文本块水平
xAlignment、 垂直 位置yAlignment、 单 元格宽度w idth、 单元格填充属性 key‑value、 文本值。
4.根据权利要求1所述的一种大数据pdf参数化配置导出方法, 其特征在于, 步骤3包
括:
步骤3.1: 获取步骤2.1中得到的font s属性中的字体类型集font ‑types属性, 获取字体
类型集属性下对应字体样式的字体路径, 得到 字体路径属性 集合ListA;权 利 要 求 书 1/3 页
2
CN 115186634 A
2步骤3.2: 获取步骤2.1中得到的fonts配置属性中的字体样式集font ‑styles属性, 获
取字体样式集下对应字体样式的字体大小、 加粗标志、 颜色, 得到字体样式集合ListB, 遍历
ListB;
步骤3.3: 获取步骤2.1中得到的page基础属性中 的布局方向layout、 页眉header、 页脚
footer;
步骤3.4: 获取步骤2.1中得到的page ‑all下级属 性文本域text ‑areas、 表格域table ‑
areas, 得到集 合ListC;
步骤3.5: 获取步骤2.1中得到的pa ge‑data属性表格域table ‑areas, 得到集 合ListD;
步骤3.6: 根据步骤3.1获取的fonts配置中的字体路径属性集合ListA, 遍历ListA, 初
始化字体;
步骤3.7: 根据步骤3.2获取的fonts配置中的字体样式集合ListB, 遍历ListB, 初始化
字体样式;
步骤3.8: 根据步骤3.3获取的page基础配置属性中的布局方向、 页眉、 页脚, 创建pdf,
设置页眉、 页脚, 判断布局方向layout值, 如果定义的值是X, 设置pdf布局为横向, 如果定义
的值是Y, 设置pdf布局方向为竖向;
步骤3.9: 根据步骤2.1获取每个文件大小size值, 需要生成的文件个数N, for循环N, 创
建PDF对象, 遍历步骤3.4获取的文本域text ‑areas、 表格域table ‑areas的集合Li stC, 遍历
ListC, 获取文本域、 表格域配置, 填充当前PDF数据, 并设置文本格式, 添加到pdf文档每页
显示中;
步骤3.10: 遍历步骤3.5获取 的表格域table ‑areas的集合ListD, , 遍历ListD, 获取文
本字体font ‑type、 字体样式font ‑style、 文本块水平位置xAlignment、 垂直位置
yAlignment、 单元格宽度widt h、 单元格填充属性key ‑value、 文本值, 组装单元格属性, 填充
数据, 并设置文本格式, 添加到pdf文档内容中。
5.根据权利要求1所述的一种大数据pdf参数化配置导出方法, 其特征在于, 步骤4包
括:
步骤4.1: 根据步骤3.9获取的循环次数N, 填充的PDF文件数据, 根据pdf文件属性中的
文件路径、 文件名称, 循环生成P DF文件;
步骤4.2: 判断pdf的文件属性 中的压缩属性, 压缩属性为true, 压缩文件, 否则, 文件数
据, 逻辑结束。
6.根据权利 要求1所述的一种大数据pdf参数化配置导出方法, 其特征在于, 步骤3.9具
体包括以下步骤:
步骤3.9.1根据步骤2.1获取PDF文件的每个文件大小size, 需要生成的文件个数N, for
循环N, 创建P DF对象;
步骤3.9.2判断page ‑all属性的下级节点是文本域text ‑areas还是表格域table ‑
areas;
如果下级节点 为文本域text ‑areas, 包 含一下步骤:
步骤3.9.2.1遍历page ‑all下级属性文本域text ‑areas、 表格域table ‑areas, 得到集
合ListC;
步骤3.9.2.2遍历步骤3.9.2.1中的集 合ListC;权 利 要 求 书 2/3 页
3
CN 115186634 A
3
专利 一种大数据pdf参数化配置导出方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:32:44上传分享