YC科技资讯网

DeepSeek将于2月春节左右推出新一代大模型,预期方向 1、V4基模型 2

DeepSeek将于2月春节左右推出新一代大模型,预期方向

1、V4基模型
2、部分用国产卡训练
3、会加强推理,这是目前全世界主流大模型的发展方向
4、用DS的mHC架构,参数量可能会有突破,做更复杂的推理任务。
5、何为超预期:
(1)编程能力如果可以超过Claude Opus4.5,那就大超预期。
(2)多模态能力,特别是多模态的理解能力。
6、利好AI应用:合合、鼎捷、汉得、税友、虹软、金山、卓易等。国产算力:寒武纪、海光。