国内媒体报道显示,深度求索计划下个月推出新一代AI大模型DeepSeek-R2。
DeepSeek-R2将应用先进的混合专家模型技术(MoE),结合智能门控网络以提升高负载任务的推理效率。
分析师指出,DeepSeek-R2定价可能低于OpenAI类似产品,有望改变现有AI服务的计价标准。
消息人士称,DeepSeek-R2成本比GPT-4减少97%,并且采用昇腾卡进行训练,注重全产业链的自主性。
相关信息透露,DeepSeek-R2参数量预计达1.2万亿,几乎是其前一代DeepSeek-R1的两倍。
该模型在华为昇腾910B芯片集群上训练,FP16精度计算能力达512PetaFLOPS,芯片效率为82%。
根据华为实验室数据,这一性能接近英伟达A100训练集群的91%。虽真实性尚待验证,但似乎更强大,更具自主性。

