搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按时间排序
按相关度排序
2 天
ChatGPT两周年,国产o1大模型们紧追不舍
在Deepseek公布的测试效果中,可以看到,DeepSeek-R1-Lite的推理时间和准确率成正比关系,即推理时长越长,跑出的效果就越好。和过往没有“慢思考”能力的模型相比,R1的表现远优于前者。
雷锋网
2 天
月之暗面发布首款数学模型 k0-math,对标o1
根据上图,在多项基准能力测试中,k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math ...
5 天
被虐哭!Epoch AI推出数学新基准FrontierMath 顶级AI模型解题数不超2%
FrontierMath的独特之处在于其严苛的评测机制。传统的数学测试基准如MATH和GSM8K已经被AI"刷爆",而这个新基准通过全新、未发表的问题和自动化验证系统,有效避免了数据污染,真正考验AI的数学推理能力。
来自MSN
7 天
Kimi 新一代数学推理模型 k0-math 正式上线
品玩11月26日讯,月之暗面官方宣布,Kimi 新一代数学推理模型 k0-math 正式上线。 官方表示,k0-math 是 Kimi ...
7 天
on MSN
月之暗面Kimi数学版上线,k0-math模型挑战OpenAI o1表现
姚立伟近日透露,月之暗面团队已正式推出了Kimimath数学版,这一新版本是基于其最新研发的数学推理模型k0-math构建的。用户现在可以通过Kimi网页版轻松访问这一功能,只需点击侧边栏的“眼镜”图标,即可体验k0-math模型带来的数学解题能力。
搜狐
17 天
月之暗面创始人杨植麟:AI 的下一个重要方向是具备“思考能力”
杨植麟表示,今天发布的最新数学模型 k0-math 有两个层面的价值,一是在教育场景应用,二是公司技术迭代和验证,未来会持续把技术放在包括 Kimi 探索版在内的更多场景中。 据新浪科技报道,杨植麟认为,接下来 AI 发展的很重要的一个方向,是使其具备思考 ...
IT之家
17 天
月之暗面发布 k0-math 数学推理模型,能力对标 OpenAI o1
IT之家11 月 16 日消息,综合第一财经,新浪科技消息,月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview。 月之暗面创始人杨植麟认为,最适合让 AI 去锻炼 ...
IT之家
18 天
LLM 数学基准测试集 FrontierMath 公布:号称多数题型 AI 没学过、业界 ...
与现有诸如 GSM-8K、MATH 等测试题集不同,FrontierMath 中的数学问题号称特别复杂,收录了现代数学中的数论、代数和几何等领域,这些题目的难度据称极高,甚至人类专家解答往往需要数小时甚至数天的时间。 IT之家获悉,FrontierMath 的题目由人工智能学方面资深 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈