专利 模型调用方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210775509.8 (22)申请日 2022.07.01 (71)申请人深圳市商汤科技有限公司地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室 (72)发明人吴晓强　暴天鹏　吴立威　 (74)专利代理机构北京派特恩知识产权代理有限公司 1 1270 专利代理师刘晖铭　徐川 (51)Int.Cl. G06F 9/445(2018.01) (54)发明名称模型调用方法、装置、设备及存储介质 (57)摘要本公开实施例提供了一种模型调用方法、装置、设备及存储介质，其中，所述方法包括：获取设定的任务流中当前待执行的任务节点；从任务流对应的网络模型集中，确定该任务节点对应的目标模型；其中，网络模型集包括第一模型子集和第二模型子集，第一模型子集中的每一第一模型的加载方式为固定加载，第二模型子集中的每一第二模型的加载方式为动态加载；在设定的存储空间中未加载目标模型的情况下，基于设定的动态加载机制，将目标模型动态加载至存储空间中，并调用存储空间中已加载的目标模型执行该任务节点；其中，存储空间用于存储固定加载的每一第一模型和当前动态加载的至少一个第二模型。权利要求书3页说明书25页附图6页 CN 115167937 A 2022.10.11 CN 115167937 A 1.一种模型调用方法，其特征在于，所述方法包括：获取设定的任务流中当前待执行的任务节点；从所述任务流对应的网络模型集中，确定所述任务节点对应的目标模型；其中，所述网络模型集包括第一模型子集和第二模型子集，所述第一模型子集中的每一第一模型的加载方式为固定加载，所述第二模型子集中的每一第二模型的加载方式为动态加载；在设定的存储空间中未加载所述目标模型的情况下，基于设定的动态加载机制，将所述目标模型动态加载至所述存储空间中，并调用所述存储空间中已加载的所述目标模型执行所述任务节点；其中，所述存储空间用于存储固定加载的每一所述第一模型和当前动态加载的至少一个所述第二模型。 2.根据权利要求1所述的方法，其特征在于，所述存储空间中包括用于存储当前动态加载的至少一个所述第二模型的缓存空间；所述基于设定的动态加载机制，将所述目标模型动态加载至所述存储空间中，包括：获取所述缓存空间的模型容量和所述缓存空间当前的使用量，并基于所述模型容量和所述使用量，确定所述缓存空间当前的可用容量；在所述可用容量小于所述目标模型的缓存占用量的情况下，从所述缓存空间中已加载的至少一个第二模型中确定优先级最低的候选模型；在所述目标模型的优先级高于所述候选模型的优先级的情况下，将所述候选模型从所述缓存空间中释放，并将所述目标模型加载至所述缓存空间中。 3.根据权利要求2所述的方法，其特征在于，所述基于设定的动态加载机制，将所述目标模型动态加载至所述存储空间中，还包括：在所述目标模型满足设定条件的情况下，确定所述目标模型的优先级高于所述候选模型的优先级；所述设定条件包括以下至少之一：所述目标模型的执行紧急程度高于所述候选模型的执行紧急程度；所述目标模型在所述任务流中的推理次数大于所述候选模型在所述任务流中的推理次数；所述目标模型的历史执行次数大于所述候选模型的历史执行次数。 4.根据权利要求1至3中任一项所述的方法，其特征在于，所述存储空间中包括用于存储当前动态加载的至少一个所述第二模型的缓存空间；所述基于设定的动态加载机制，将所述目标模型动态加载至所述存储空间中，包括：以所述目标模型为遍历起始点，依次遍历设定的模型加载队列中的每一第二模型，并针对遍历过程中访问的每一第二模型，基于所述第二模型的状态信息，将所述第二模型加载至所述缓存空间中，所述模型加载队列中包括所述第二模型子集中的至少一个第二模型。 5.根据权利要求4所述的方法，其特征在于，每一所述第二模型的状态信息包括待加载状态或跳过状态；所述基于所述第二模型的状态信息，将所述第二模型加载至所述缓存空间中，包括：在所述第二模型的状态信息为待加载状态的情况下，将所述第二模型加载至所述缓存空间中，并将所述第二模型的状态信息更新为跳过状态；在所述第二模型的状态信息为跳过状态的情况下，结束访问当前的第二模型，并继续访问所述模型加载队列中的下一个第二模型。 6.根据权利要求 4或5所述的方法，其特征在于，所述方法还包括：权　利　要　求　书 1/3 页 2 CN 115167937 A 2基于所述任务流中各任务节点之间的依赖关系，确定所述第二模型子集中每一第二模型之间的执行依赖关系；基于所述第二模型子集中每一第二模型之间的执行依赖关系，确定所述任务流对应的模型加载队列，以及所述模型加载队列中每一第二模型的状态信息。 7.根据权利要求6所述的方法，其特征在于，所述第二模型子集中每一第二模型之间的执行依赖关系包括每一第二模型之间的执行依赖图；所述基于所述第二模型子集中每一第二模型之间的执行依赖关系，确定所述任务流对应的模型加载队列，以及所述模型加载队列中每一第二模型的状态信息，包括：采用深度遍历的方式遍历所述执行依赖图中的每一第二模型，得到所述任务流对应的模型加载队列；基于当前待执行的任务节点对应的目标模型的数据流通状态，对所述执行依赖图中每一第二模型的数据流进行预测，得到每一所述第二模型的数据流通状态；基于至少一个所述第二模型的数据流通状态，确定每一所述第二模型的状态信息。 8.根据权利要求7所述的方法，其特征在于，所述数据流通状态包括数据流入状态；所述基于至少一个所述第二模型的数据流通状态，确定每一所述第二模型的状态信息，包括：采用深度遍历的方式遍历所述执行依赖图中的每一第二模型，针对遍历过程中访问的每一第二模型，执行以下之一操作：在所述第二模型的数据流入状态为有数据流入的情况下，将所述第二模型的状态信息确定为待加载状态；在所述第二模型的数据流入状态为无数据流入的情况下，确定所述执行依赖图中以所述第二模型为根节点的第一子图，并将所述第一子图中的每一第二模型的状态信息确定为跳过状态。 9.根据权利要求7或8所述的方法，其特征在于，所述数据流通状态包括数据流入状态和数据流出状态；所述基于至少一个所述第二模型的数据流通状态，确定每一所述第二模型的状态信息，包括：基于至少一个所述第二模型的数据流入状态和数据流出状态，确定所述执行依赖图中相邻的每两个第二模型之间的数据连通关系；从至少一个所述第二模型中，确定与所述目标模型之间具有数据连通关系的第三模型子集；将所述第三模型子集中的每一第二模型的状态信息确定为待加载状态。 10.根据权利要求2或3所述的方法，其特征在于，所述获取所述缓存空间的模型容量，包括：基于所述第一模型子集中每一第一模型的存储占用量，确定所述存储空间中固定占用的第一存储容量；基于所述存储空间的总存储容量与所述第一存储容量之间的差值，确定所述缓存空间的第二存储容量；基于所述缓存空间的第二存储容量和所述第二模型子集中每一第二模型的存储占用量，确定所述缓存空间的模型容量；其中，所述模型容量表征所述缓存空间中可加载第二模型的数量。权　利　要　求　书 2/3 页 3 CN 115167937 A 3

专利 模型调用方法、装置、设备及存储介质

专利模型调用方法、装置、设备及存储介质