你完全需要VM来做人工智能
富有硬度的VMware正试图通过收购Bitfusion来跟上这些年轻人的步伐,Bitfusion是一家声称通过网络连接GPU的魔力在任何虚拟机上实现机器学习的创业公司。
交易完成后,此功能将集成到VMware的vSphere服务器虚拟化平台中。
该协议的确切条款尚未披露 - 但自2015年以来,Bitfusion已经吸引了包括三星风险投资公司和Xilinx在内的两轮投资的830万美元资金。
该公司总部位于德克萨斯州奥斯汀市,并通过名为FlexDirect的软件平台推销其称为“弹性人工智能”的东西。
Bitfusion表示,它可以为商用硬件集群上的机器学习工作负载提供超级计算级别的性能,而无需对应用程序本身进行任何更改。
新贵一直与VMware接近 - 其参考架构在Supercomputing 2018上展示,基于vSphere和Mellanox的网络硬件。
传统的机器学习方法涉及直接连接到各个裸机服务器的GPU。使用Bitfusion的平台,分散在数据中心的网络连接GPU(NAG?)成为公共资源池的一部分,与虚拟化计算和存储已经完成的方式相同。
然后,该GPU资源池的灵活块(包括GPU的一部分)可以被网络上的任何虚拟机用于训练或推理。
“我们认为Bitfusion是硬件加速的产品,几年前VMware首次提供给计算领域,” VMware的战略和企业发展部门负责人Alex Wang 表示。
FlexDirect支持任何类型的GPU服务器和任何网络配置,包括TCP,RoCE和InfiniBand。该平台还支持其他类型的加速器,如FPGA和ASIC。在软件方面,它适用于CUDA和OpenCL框架,这意味着它可以处理来自Nvidia或AMD的卡。
Bitfusion称其技术有助于最大限度地提高GPU利用率 - 而且机器学习加速器通常是服务器中最昂贵的部分,这可能有助于降低硬件成本。
它甚至可以在公共云中运行。客户可以随时保持计算服务器的运行,并且只有在工作负载需要时才能访问远程GPU。
VMware似乎已经着手获取性感的现代功能,而不是在内部构建它们:仅在过去的六个月中,它宣布有意收购应用程序包装专家Bitnami和Kubernetes新贵Heptio。