安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211148564.0 (22)申请日 2022.09.21 (71)申请人 之江实验室 地址 311121 浙江省杭州市余杭区之江实 验室南湖总部 (72)发明人 蒋纪琼 潘淑 陈志伟 (74)专利代理 机构 北京志霖恒远知识产权代理 有限公司 1 1435 专利代理师 戴莉 (51)Int.Cl. G06F 8/60(2018.01) G06F 9/445(2018.01) G06F 9/54(2006.01) H04L 67/02(2022.01) H04L 67/10(2022.01)H04L 67/133(2022.01) H04L 67/51(2022.01) (54)发明名称 一种支持多种深度学习框架模型云端部署 的装置及方法 (57)摘要 本发明公开了一种支持多种深度学习框架 模型的云端部署装置及方法, 将模 型以线上服务 的形式部署在云端 服务器, 支持使用http和gRPC 两种通信协议提供在线推理服务, 包括如下步 骤: 步骤一、 根据方法说明部署模型云端部署装 置及网关装置; 步骤二、 训练待部署的模 型, 并保 存为其所使用的深度学习框架对应的可支持部 署的模型格式; 步骤三、 根据模型采用的深度学 习框架及方法中提供的必要的依赖包, 制作可支 持模型部署的镜像; 步骤四、 根据装置页面要求 选择合适的参数将该模型进行云端部署。 本发明 操作简单, 用户无须精通算法即可在本装置中同 时部署多种深度学习框架训练的模 型, 且易于扩 展, 同时支持其 他深度学习框架模型部署。 权利要求书2页 说明书5页 附图2页 CN 115248692 A 2022.10.28 CN 115248692 A 1.一种支持多种深度学习框架模型云端部署的方法, 其特 征在于, 包 含以下步骤: S1: 部署模型云端部署装置、 网关装置, 配置Serving引擎的路径, 并准备待部署的模型 及环境镜像; S2: 在云端部署装置前端页面中选择待部署模型并创建在线推理服务, 后台根据选择 的服务类型自动 构建模型部署启动命令及相关的在线推理服务参数, 并为每个服务分配唯 一的推理请求 域名; S3: Kubernetes容器集群管理系统根据配置 的节点数和节点规格创建容器, 为模型部 署的每个容器分配对应的路由转发, 并根据服 务方式运行Servi ng引擎中的启动脚本; S4: 容器创建成功后, 启动Serving引擎, 调用步骤S2中在线推理服务参数对应的推理 脚本或自定义推理脚本加载待部署模型; S5: 模型加载成功后, 即表示该模型在云端服务器部署成功后, 提供在线推理服务, 用 户通过装置页面中的预测按 钮调用推理请求, 对该模型的在线推理服 务进行测试; S6: 用户根据实际场景, 调用装置页面 提示的请求路径, 进行在线推理; 其中, 通过http通信协议提供的在线推理服务, 网关装置中统计出该服务被调用的总 次数和失败次数; 通过gRPC通信协议提供的在 线推理服务, 在gRPC Server中统计该服务被 调用的总次数和失败次数。 2.根据权利要求1所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 所述步骤S2 中选择模型创建在线推理服务时, 选择http通信协议或gRPC通信协议提供 服务。 3.根据权利要求2所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 所述步骤S2中通过http通信协议提供的在线推理服务, 网关装置中统计出该服务被调 用的总次数和失败次数; 通过gRPC通信协 议提供的在 线推理服务, 在gRPC Server中统计该 服务被调用的总次数和失败次数。 4.根据权利要求1所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 所述步骤S1中选择模型进行云端部署时, 选择单节点部署或多节点部署; 多节点部署 时, 各节点的请求路径相同, 每 个节点平分该服 务的推理请求。 5.根据权利要求1所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 所述步骤S2中部署模 型云端部署装置时, 选择调用CPU或GPU类型的节 点部署模 型, 并设 置每个节点的规格。 6.根据权利要求1所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 步骤S2中当选择ht tp通信协议部署模型时, 选择 是否进行 灰度发布。 7.根据权利要求1所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 所述步骤S2的在线推理服 务参数包括启动脚本、 框架名称。 8.根据权利要求1所述的一种支持多种深度学习框架模型云端部署的方法, 其特征在 于: 所述步骤S5中用户调用推理请求时, Nginx根据推理请求域名将请求转发至网关装置, 网关装置在接收到推理请求后, 根据路由配置转发到该在线服务的Kuber netes ingress域 名地址。 9.一种支持多种深度学习框架模型云端部署的装置, 其特征在于, 包括互相连接的云 端部署装置、 网关装置和Servi ng引擎;权 利 要 求 书 1/2 页 2 CN 115248692 A 2所述的云端部署装置用于与用户交互, 接收用户输入的待部署模型的相关信息, 并根 据部署规格参数进行模型部署; 所述的网关装置用于在ht tp通信协议下提供鉴权、 统计和调配服 务; 所述的Servi ng引擎用于提供接口封装、 模型加载和数据处 理。 10.根据权利要求9所述的一种支持多种深度 学习框架模型云端部署的装置, 其特征在 于: 所述的云端部装置包括Kubernetes容器集群管理系统, 所述的Kubernetes容器集群管 理系统用于管 理云平台中多个服务器节 点上的容器化的应用, 模 型部署在Kuber netes容器 中, 并通过 Kubernetes对各个节点进行统一调度, 提供相应服 务。权 利 要 求 书 2/2 页 3 CN 115248692 A 3
专利 一种支持多种深度学习框架模型云端部署的装置及方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 16:33:12
上传分享
举报
下载
原文档
(486.1 KB)
分享
友情链接
GB-T 7666-2005 传感器命名法及代号.pdf
GB-T 35279-2017 信息安全技术 云计算安全参考架构.pdf
数据安全能力建设实施指南 V1.0(征求意见稿).pdf
DB37-T 4319—2021 水利物联网终端技术规范 山东省.pdf
中国移动 5g r17、r18技术解读.pdf
GB-T 6406-2016 超硬磨料 粒度检验.pdf
GB-T 33817-2017 铜及铜合金管材内表面碳含量的测定方法.pdf
数据分级分类实施参考案例集.PDF
GB-T 27769-2011 社会保障服务中心设施设备要求.pdf
T-GDYLSH 2.1—2022 旅居养老服务 第1部分:总则.pdf
GB-T 1425-2021 贵金属及其合金熔化温度范围的测定 热分析试验方法.pdf
GB-T 35673-2017 工业通信网络 网络和系统安全 系统安全要求和安全等级.pdf
T-GDTL 002—2018 建筑地坪涂装工程施工及验收规程.pdf
GB-T 25810-2019 染料 产品标志、标签、包装、运输和贮存通则.pdf
GB-Z 41599-2022 车辆总质量监测.pdf
DB50-T 1074-2021 研学旅行承办方服务规范 重庆市.pdf
炼石网络 数据存储加密技术白皮书 v1.8.pdf
GB-T 21064-2007 电子政务系统总体设计要求.pdf
GB-T 24108-2009 岩土工程仪器可靠性技术要求.pdf
GB-T 31497-2024 信息技术 安全技术 信息安全管理 监视、测量、分析和评价.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(486.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。