11月27日晚,DeepSeek悄悄地在Hugging Face上开源了一个新模型:DeepSeek-Math-V2。这是一个数学方面的模型,也是目前行业首个达到IMO(国际奥林匹克数学竞赛)金牌水平且开源的模型。
当前,已官宣拿下金牌的两大模型,一款来自谷歌Gemini Deep Think,另一款便来自OpenAI的内部模型。
核心技术架构
基础模型支撑:该模型基于DeepSeek-V3.2-Exp-Base构建,延续了基础模型的强大推理底座。
自验证训练框架:这是其核心亮点,模型借助LLM验证器自动审查生成的数学证明过程,同时筛选高难度数学样本持续优化自身推理性能,让推理结果更具可靠性,解决了传统数学模型推理过程难校验、易出错的问题。
竞赛与基准测试表现
该模型在国际顶尖数学竞赛相关测试中展现出超高水平,打破了此前专有模型在高端数学推理领域的优势局面。具体来看,它在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌分数水平;在面向本科生的2024年普特南数学竞赛(Putnam 2024)中更是取得118/120的近乎满分成绩,充分证明其在高中到本科阶段高难度数学问题上的推理能力。
开源与应用价值
开源属性:模型的代码与权重已完全开源,目前可在Hugging Face及GitHub平台获取,开发者和研究者可直接基于该模型开展二次开发或相关研究。
行业意义:其自验证推理路径的成功实践,为构建可靠的数学智能系统提供了新方向。未来该模型不仅可用于辅助学生、研究者解决数学难题、生成严谨证明,还可能为物理、化学等依赖复杂数学推理的学科提供计算与推理支持。
在avavox刚刚进入产品商业化阶段,就已经接入deepseek大模型。avavox具备泛用行业知识,交互语音对话灵活智能,可以像真人一样追问,获取高质量、有深度的答案。


