DeepSeek大模型:低成本、高性能,引发硅谷震动

2025-01-31 16:07:16 图像生成 author

中国AI初创公司DeepSeek在短短一个月内连续发布DeepSeek-V3和DeepSeek-R1两款大模型,其低廉的成本和与OpenAI相当的性能引发了硅谷的震惊和Meta内部的恐慌。Scale AI创始人Alexander Wang称DeepSeek模型在测试中表现最佳,甚至认为DeepSeek-V3是中国科技界带给美国的“苦涩教训”,凸显了中国AI发展的速度和实力。 DeepSeek-V3在开源模型中排名第一,性价比最高;DeepSeek-R1则在多个基准测试中名列前茅,尤其在高难度提示词、代码和数学等领域表现出色,且在风格控制方面与顶级模型o1并列第一。其成本仅为o1的三十分之一,这引发了人们对AI行业巨额资本投入有效性的质疑,也让许多海外投资者对AI巨头的未来发展产生担忧,甚至认为美股芯片股的股价将面临挑战。 Meta员工爆料称公司内部已进入恐慌模式,工程师们正努力复制DeepSeek的技术。知名投资人如马克·安德森也对DeepSeek-R1给予高度评价。诺奖得主杰弗里·辛顿认为,中国优秀的STEM教育和人才储备是AI快速发展的基础。DeepSeek的成功,也让国外媒体纷纷聚焦,认为中国AI的进展为硅谷敲响了警钟,并引发了关于AI行业“护城河”和资本效率的大讨论。

发表评论:

最近发表