DeepSeek发布最新开源数学推理模型Prover-V2-671B
【太平洋科技快讯】4月30日消息,DeepSeek 在 AI 开源社区 Hugging Face 发布了其最新数学推理模型——DeepSeek-Prover-V2-671B。该模型参数量高达 6710 亿,从命名推测,这可能是对去年发布的 Prover-V1.5 模型的重大升级。
DeepSeek-Prover-V2-671B 基于混合专家(MoE)架构,并采用 Lean 4 框架进行形式化推理训练。该模型结合了强化学习和大规模合成数据,显著提升了自动化证明能力。此外,新模型支持 BF16、FP8 和 F32 等多种计算精度,并采用高效的 safetensors 文件格式,使得训练和部署更加快速且节省资源。
该模型的发布也可能为 DeepSeek 的 R2 系统铺路,进一步验证其在复杂推理任务中的能力。同时,它也为 AI 在数学领域的应用提供了新的可能性,例如加速数学知识的发现和验证。