发布模型
完成模型校验成功后,点击右上方操作栏【发布上线】,进行模型在线部署。
备注:(1)具体模型校验的流程,详情请了解【校验模型】。
填写相关信息,点击确定,进行模型发布。
- APP-KEY授权:添加App-Key授权后,在API调用时,在Header中添加 'App-Key'='value' 才可正确访问;
- 计算目标:下拉框选择模型部署的算力主机;
- 分配cpu/gpu/内存:自定义分配cpu/gpu/内存信息;
- 基础镜像:下拉框选择该模型的依赖的基础镜像环境;
- 环境变量:自定义环境变量;
- 更新部署:如果该模型曾经部署过,选择是否覆盖之前部署,不选择,默认不覆盖;
- 接口类型:自定义选择http/队列的接口类型。
备注:若选项下拉框为空,(1)先确认用户角色是否具有该操作权限。角色权限说明,详情请了解【角色管理】;(2)若存在权限,再次确认是否匹配相应资源,详情请了解【主机管理】。
若发布成功,则显示发布成功弹窗;反之,则显示发布失败弹窗。
至此,已完成模型在线部署。