首页 > 科学

DeepSeek发布最新开源数学推理模型Prover-V2-671B

【太平洋科技快讯】4月30日消息，DeepSeek 在 AI 开源社区 Hugging Face 发布了其最新数学推理模型——DeepSeek-Prover-V2-671B。该模型参数量高达 6710 亿，从命名推测，这可能是对去年发布的 Prover-V1.5 模型的重大升级。

DeepSeek-Prover-V2-671B 基于混合专家(MoE)架构，并采用 Lean 4 框架进行形式化推理训练。该模型结合了强化学习和大规模合成数据，显著提升了自动化证明能力。此外，新模型支持 BF16、FP8 和 F32 等多种计算精度，并采用高效的 safetensors 文件格式，使得训练和部署更加快速且节省资源。

该模型的发布也可能为 DeepSeek 的 R2 系统铺路，进一步验证其在复杂推理任务中的能力。同时，它也为 AI 在数学领域的应用提供了新的可能性，例如加速数学知识的发现和验证。