近日,6710亿参数的巨型语言模型DeepSeek-R1引发广泛关注。英伟达官方宣布,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供,可在单个NVIDIA HGX H200系统上每秒处理多达3872个令牌。DeepSeek-R1采用独特的测试时间扩展技术,通过多次推理、思路链、共识和搜索方法生成更精准的答案。其高性能依赖于NVIDIA Hopper架构的FP8 Transformer Engine和高速NVLink互联。
DeepSeek-R1模型的开源特性,也促使了伯克利大学研究人员成功复现了一个小型版本TinyZero,成本仅约30美元,进一步降低了该类模型的研发门槛。微软也已将DeepSeek R1加入Azure AI Foundry模型目录。
DeepSeek-R1的出现,引发了业界对AI产业格局的讨论。虽然部分分析师认为DeepSeek的成功动摇了美国AI行业的领先地位,但也有专家认为其影响被夸大。私募巨头黑石集团总裁Jonathan Gray表示,尽管AI计算能力成本下降,但对数据中心等基础设施的需求依然强劲,黑石将继续投资数据中心建设,以应对未来AI应用的增长需求。