星云智联发布S1400系列AI智算高速互联网卡,深度适配 DeepSeek,加速国产AI算力生态发展
来源:赛迪网    作者:赛迪网2025-06-10 14:41:26

星云智联于6月3日正式推出S1400系列AI智算高速互联网卡。该系列产品针对人工智能大模型训练与推理等智算场景的严苛需求,凭借其全自研核心技术与卓越性能,提供极致高效、稳定可靠的全场景互联解决方案与坚实的网络底座。 值得关注的是,该产品已成功适配DeepSeek的DeepEP开源通信库,显著提升AI计算集群的通信效率,为AI应用创新注入强劲动力。

S1400系列AI智算高速互联网卡具备1x400G或2x200G的网络接口模式,采用PCIe Gen 5.0 x16接口,提供高达双向100Mpps的RDMA消息速率。其关键特性包括:全面支持RoCEv2协议标准,并兼容NCCL、DeepEP,BCCL等主流集合通信库,确保与现有AI生态的无缝对接。另外,S1400支持先进的GPUDirect技术(GDR、GDA)、用户态MR(UMR)操作,为大规模AI计算集群提供了极致的低延迟和高带宽。尤为突出的是,S1400系列AI智算高速互联网卡自研NBL-SRP协议支持对所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的乱序接收和选择性重传,并针对GPU侧Atomic操作和低延迟Local read进行了特别优化,这些特性进一步弥补了国内生态在此方面的不足。S1400系列AI智算高速互联网卡大幅优化了数据处理流程,显著提升了AI智算场景下的互联效率。

在拥塞控制方面,S1400系列搭载了星云智联自研的NBL-CC算法。该算法基于RTT探测与丢包统计进行主动的端到端拥塞控制,不依赖交换机特定配置,具有参数少、部署便捷、性能优异的特点,能实现快速启动、快速收敛,并保持交换机低队列深度与高吞吐量。实际测试数据显示,NBL-CC相较于传统的DCQCN算法,在平均性能上提升50%,99分位性能提升48%,尤其在短流场景下提升幅度高达60%-100%,有效保障了网络的低队列拥塞和持续高吞吐。配合自研的NBL-SRP协议(逐包多路径、DDP乱序接收、选择性重传、快速重传),S1400系列AI智算高速互联网卡在AI主流场景及有损网络下都能够充分发挥接口带宽潜力,其NCCL通信性能在多个关键指标上展现出持平并且部分超越业界标杆产品,并在特定业务场景时延测试中表现出与国际顶尖产品相媲美的168us优异数据(GDR write 7M + atomic),展现了强大的市场竞争力。

在全球AI算力需求激增的背景下,星云智联通过自研芯片和算法,成功打造出性能媲美国际水平的高端网络产品,星云智联S1400系列产品的发布不仅填补了国产智算高速互联网卡的市场空白,更通过与 DeepSeek等领先AI企业的深度适配,推动国产AI基础设施的协同创新,为国产化技术在AI领域的广泛应用奠定了基础。 星云智联强调,未来将深化与 AI产业链伙伴的合作,持续优化产品性能,为中国AI算力生态的自主可控发展提供坚实支撑。

Dell PowerStore 4.1引领存储现代化,开启IT架构新时代

面对新型工作负载的持续涌现以及经济环境的不断变化,HCI如今正面临重重挑战。现代化技术、容器以及边缘应用的普及,进一步凸显其资源利用率低下、计算与存储难以独立扩展,以及高度依赖单一虚拟化平台等弊端。

2025-06-10 14:38

AI推理走向边缘,Akamai在KubeCon China...

凭借覆盖全球130多个国家和地区、超1200个网络的4200多个节点,Akamai构建了业界领先的分布式边缘云平台,具备在分布式与边缘环境中支持多样化需求的独特优势。

2025-06-10 14:47
你可能也喜欢这些文章