方案介绍

SCHEME

GPU集群管理:包括基础设施服务(Infrastructure as a Services)-兼容国内外主流生态,平台服务(Platform as a Services)-应用运行平台和平台服务的核心,应用服务(Application as a Services)-支持可视化训练和开发。

虚拟化介绍

Virtualization

KVM+vCUDA

基于POD使用vCUDA.

统一虚拟化接口,和驱动解耦.

k8s+vCUDA

基于容器的GPU虚拟化.

采用vCUDA开源方案.

性能测试

performance

方案优势

advantages

  • 支持GPU虚拟化

     

    支持GPU虚拟化,虚拟化的颗粒度是1/100,即一张实际的GPU可以虚拟出100张

  • 集成分布式训练框架

     

    集成分布式训练框架,数据集和算法,便于大规模AI应用开发

  • 图形化交互页面

     

    图形化交互界面,便于POD管理,系统监控,资源分配

  • 统一管理

     

    支持GPU虚拟化,虚拟化的颗粒度是1/100,即一张实际的GPU可以虚拟出100张

应用对象

OBJECT

需要turn key方案

需要支持GPU虚拟化客户

需要多服务器管理