首页> 智能生活>  正文
速度2.6倍提升,TencentOS 支持满血版DeepSeek
来源:赛迪网     作者:赛迪网 2025-03-17 14:54:47
微信分享二维码

扫码分享到微信

关闭

TencentOS Server AI全面支持满血版DeepSeek R1,在双机16卡的硬件环境上,分别在短输入场景(如知识问答)以及长输入场景(如企业私有信息的检索增强生成)均获得超过2.6倍的推理性能提升!

本性能评估采用2台8卡服务器,显存总量共1536GB,部署TencentOS Server AI版,2台服务器采用RDMA高速网络互联,测试样本采用通用的数据集。分别测试输入200tokens/输出500tokens以及输入6144tokens/输出1024tokens下的吞吐能力,测试结果如下:

TencentOS Server AI是腾讯云发布的一款针对AI场景的操作系统,提供了从基础架构到AI框架以及模型的全栈式AI环境,一方面简化部署,另一方面通过高性能的AI框架,实现大模型如DeepSeek推理效率成倍的增加。

新商照时代来临,宜美照明引领行业“光”速发展

推动智能化发展宜美照明将物联网、人工智能等新技术融入产品研发宜美照明坚持创新驱动发展包括商业、酒店…

2025-03-17 14:52

从“无感理赔”到“智慧调解”,泰康在线以“服务好”守护消费...

理赔服务一体化、客诉处理线上化、消保宣教全面化医院诊疗数据、医保结算信息与保险理赔标准实现了毫秒级…

2025-03-17 14:56
你可能也喜欢这些文章