math - 搜索 News

2 天

在Deepseek公布的测试效果中，可以看到，DeepSeek-R1-Lite的推理时间和准确率成正比关系，即推理时长越长，跑出的效果就越好。和过往没有“慢思考”能力的模型相比，R1的表现远优于前者。

根据上图，在多项基准能力测试中，k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型：o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中，k0-math ...

5 天

被虐哭！Epoch AI推出数学新基准FrontierMath 顶级AI模型解题数不超2%

FrontierMath的独特之处在于其严苛的评测机制。传统的数学测试基准如MATH和GSM8K已经被AI"刷爆"，而这个新基准通过全新、未发表的问题和自动化验证系统，有效避免了数据污染，真正考验AI的数学推理能力。

来自MSN7 天

Kimi 新一代数学推理模型 k0-math 正式上线

品玩11月26日讯，月之暗面官方宣布，Kimi 新一代数学推理模型 k0-math 正式上线。官方表示，k0-math 是 Kimi ...

7 天on MSN

月之暗面Kimi数学版上线，k0-math模型挑战OpenAI o1表现

姚立伟近日透露，月之暗面团队已正式推出了Kimimath数学版，这一新版本是基于其最新研发的数学推理模型k0-math构建的。用户现在可以通过Kimi网页版轻松访问这一功能，只需点击侧边栏的“眼镜”图标，即可体验k0-math模型带来的数学解题能力。

搜狐17 天

月之暗面创始人杨植麟：AI 的下一个重要方向是具备“思考能力”

杨植麟表示，今天发布的最新数学模型 k0-math 有两个层面的价值，一是在教育场景应用，二是公司技术迭代和验证，未来会持续把技术放在包括 Kimi 探索版在内的更多场景中。据新浪科技报道，杨植麟认为，接下来 AI 发展的很重要的一个方向，是使其具备思考 ...

IT之家17 天

月之暗面发布 k0-math 数学推理模型，能力对标 OpenAI o1

IT之家11 月 16 日消息，综合第一财经，新浪科技消息，月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示，Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型：o1-mini 和 o1-preview。月之暗面创始人杨植麟认为，最适合让 AI 去锻炼 ...

IT之家18 天

LLM 数学基准测试集 FrontierMath 公布：号称多数题型 AI 没学过、业界 ...

与现有诸如 GSM-8K、MATH 等测试题集不同，FrontierMath 中的数学问题号称特别复杂，收录了现代数学中的数论、代数和几何等领域，这些题目的难度据称极高，甚至人类专家解答往往需要数小时甚至数天的时间。 IT之家获悉，FrontierMath 的题目由人工智能学方面资深 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果