精打细算,几万块就能入手128G显存AI服务器,你敢信吗?

间隙填充
正睿科技  发布时间:2024-09-21 14:09:34  浏览数:401

在追求AI算力的时代,显卡显存的需求不断攀升。特别是在进行大规模模型训练时,充足的显存能够有效提升模型的处理速度和规模。然而,动辄几十万元甚至上百万的单机预算让不少企业望而却步——比如市面上常见的Nvidia A100 80G显卡,单卡价格就已经突破十几万。如果想组建一套上百GB显存的高性能AI服务器,按照常规方案,预算起步就是六位数。

1726888757316.jpg

动辄上百GB的显存需求属实有点恐怖,那么,在数万元的预算内,实现上百GB显存的AI计算服务器可能吗?

另辟蹊径:小众GPU也有大作用

在为AI应用挑选GPU时,用户往往只信赖昂贵的NVIDIA的专业计算卡,预算吃紧时也往往使用消费级N卡进行替代,几乎不会有其他的选择。

那如果我告诉你英特尔的GPU是一个不错的选择,如果采用Arc A770,单卡16GB,组一台128G显存的八卡GPU服务器仅需几万块。不过现在你可能觉得我在开玩笑。A卡都还没考虑哪能轮的上i卡,况且i卡连游戏都还没玩明白呢怎么跑AI?那我告诉你,这还真能成!


英特尔GPU入行晚,导致长期以来,在常规应用里,i卡都排在N卡A卡后面。而在AI应用中,用户对英特尔GPU性能的误解,实际上问题往往出在配置上,而不是硬件本身。许多人在运行AI模型时直接使用为NVIDIA CUDA优化的代码,而忽视了英特尔的扩展工具,如IPEX(Intel Extension for PyTorch),导致GPU无法被合理调度,性能被浪费

很多人可能不知道,英特尔是Pytorch的最大贡献者之一,他们的硬件对AI做出专门的优化适配也就很正常了。


那么这套玩法能带来多少性能呢?这里是使用 IPEX-LLM 库在 Intel Arc A770 显卡(使用 Intel® Core™ i7-12700 处理器作为主机平台)上运行的 LLM 推理的令牌延迟,范围为 60 亿到 130 亿个参数。测试在 Ubuntu* 22.04 上进行,具有 1,024 个输入令牌,批处理大小为 1。

1726887933818009510.png

看完单卡性能测试,让我们看看再实际应用中的多卡表现:

1726889461555098422.jpg

1726889465226092634.jpg

性能也还不错吧,更关键的是,这种多卡方案真真切切的解决AI模型了“能不能跑”的问题,性价比拉满,况且跑的性能也还不错。

配置方法在这里放出来啦:


英特尔 Arc A 系列显卡的 Linux 环境中安装 IPEX-LLM 库的说明。安装指南中提供了更多详细信息。


使用低位优化推理 LLM
要在Intel Arc系列显卡上运行您的 LLM 模型,请参阅 GPU 示例。

from ipex_llm.transformers import AutoModelForCausalL
model = AutoModelForCausalLM.from_pretrained('/path/to/model/', load_in_4bit=True).to("xpu")


该模型被转换为低位并加载到正在运行的硬件 (XPU),然后,应用各种硬件和软件优化以加速 LLM 推理。

提供了更多示例,例如 FP8、int8 和 FP4 推理,保存和加载 IPEX-LLM 库低位模型,或直接加载包括 GGUF、激活感知量化 (AWQ)、GPU 训练后量化 (PTQ) 在内的量化模型,并且您可以使用 LangChain 和 LlamaIndex 等社区库构建 IPEX-LLM 库应用程序。


配置太复杂?交给我们吧!

正睿八卡服务器 一站式无忧部署

正睿八卡服务器,ZI2M7S8-20296-TC8。这款3U机架式服务器,搭载了两颗Xeon Silver 4210处理器,128GB DDR4 REG ECC内存,1TB NVMe M.2 SSD,支持双千兆网络,采用的Intel Arc A770 16G显卡,并且最多支持8卡配置,总显存可达到128G。

凭借这样的配置,您可以用数万元的预算就轻松拥有一套高性能AI训练平台,不再需要为高昂的Nvidia专业计算卡成本买单。

...企业微信截图_17268988852563.png

硬件性能与管理配置一应俱全

不仅仅是显卡,ZI2M7S8-20296-TC8的整体硬件架构也是为高效运算设计的。双路Xeon Silver 4210 CPU提供强大的并行处理能力,配合128GB的RECC内存,保证数据传输的稳定性。1TB的NVMe SSD为高速存储需求提供支持,无论是数据缓存还是模型存储,都能流畅应对。

无论是AI训练、深度学习任务,还是高性能计算需求,正睿八卡服务器凭借其128G的显存和强大配置,提供了一个极具性价比的选择。

而且本产品的正睿远程管理功能,作为您服务器产品的内置智控核心,不仅实现了全天候的硬件状态监控,确保每一项硬件指标尽在掌握,而且通过深度分析运行数据,为您提供了前所未有的洞察力。它能够即时收集并解析CPU负载、内存使用、存储容量及网络流量等关键信息,助力您依据详实的数据反馈,灵活调整经营策略与业务部署,实现资源的最优化配置和运营效率的显著提升,真正做到了以数据驱动决策,让您的业务管理更加智能高效。

了解正睿远程管理

1-1.jpg

正睿产品,放心购买

在售后服务方面,我们有三年质保、全国联保的强有力的支持承诺。购买本产品的用户在全国范围内,只要有授权的服务网点,都可以享受原厂级别的保修支持,确保服务器在整个质保期内得到专业及时的维护保障。此外,正睿还为有需求的客户提供增值延保服务选项,让设备在过保后依然能获得专业的延续保障,延长服务器的生命周期,最大程度地降低用户的运维成本和风险。

与此同时,正睿还建立了全天候的一对一技术支持体系,无论是前期的产品咨询、中期的安装调试还是后期的运维服务,客户均可随时联系获取专业的7x24小时在线技术支持和指导,确保在使用过程中的任何疑问和问题都能得到及时有效的解答与解决。一系列完善的售后保障措施,都将为您提供无忧的使用体验,使本产品在性价比、性能表现和用户体验上达到了一个新的高度。

增值服务项目

1714289414049060035.jpg

产品图片        不合您的口味?

联系客服购买        正睿帮您生产