Tritonserver 在得物的最佳实践
出处:
mp.weixin.qq.com
作者:
xujiong
Tritonserver是Nvidia推出的基于GPU和CPU的在线推理服务解决方案,因其具有高性能的并发处理和支持几乎所有主流机器学习框架模型的特点,是目前云端的GPU服务高效部署的主流方案。
Tritonserver的部署是以模型仓库(Model Repository)的形式体现的,即需要模型文件和配置文件,且按一定的格式放置如下,根目录下每个模型有各自的文件夹。
查看原文
8
技术
lddgo
分享于
2024-10-21