SCHEME
GPU集群管理:包括基础设施服务(Infrastructure as a Services)-兼容国内外主流生态,平台服务(Platform as a Services)-应用运行平台和平台服务的核心,应用服务(Application as a Services)-支持可视化训练和开发。
Virtualization
KVM+vCUDA
基于POD使用vCUDA.
统一虚拟化接口,和驱动解耦.
k8s+vCUDA
基于容器的GPU虚拟化.
采用vCUDA开源方案.
performance
advantages
支持GPU虚拟化
支持GPU虚拟化,虚拟化的颗粒度是1/100,即一张实际的GPU可以虚拟出100张
集成分布式训练框架
集成分布式训练框架,数据集和算法,便于大规模AI应用开发
图形化交互页面
图形化交互界面,便于POD管理,系统监控,资源分配
统一管理
支持GPU虚拟化,虚拟化的颗粒度是1/100,即一张实际的GPU可以虚拟出100张
OBJECT
需要turn key方案
需要支持GPU虚拟化客户
需要多服务器管理