搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
3 天
一个世纪以来,看似简单的数学问题取得了重大进展
关于质数的新证明阐明了加法和乘法之间的微妙关系,并为著名的abc猜想取得进展带来了希望。加法和乘法都是相对简单的运算。但当两者结合起来时,就会引出数学家仍在努力理解的深刻问题。图源:Samuel Velasco / Quanta ...
12 天
大模型在装傻,谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比 ...
近日,来自谷歌和苹果的研究表明:AI模型掌握的知识比表现出来的要多得多!这些真实性信息集中在特定的token中,利用这一属性可以显著提高检测LLM错误输出的能力。 大模型的应用历来受幻觉所扰。
民用航空网
10 天
Claude 3.5深夜觉醒,学会模仿人类用电脑
太科幻了,深夜上线的 Claude,可以像人类一样使用计算机了?查看屏幕、移动光标、点击按钮、输入文本,还能查找代码错误、自动搜集信息填表。AI 推理已至瓶颈,下一个爆破点,就是 AI 操作电脑!本文转载自微信公众号新智元。Claude 3.5 ...
4 天
古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能 ...
Grok 回答:图片中的饮料是「백세주(Baekseju)」 ,这是一种传统的韩国酒精饮料。它是一种用人参和其他草药浸泡的米酒,以其假定的健康益处而闻名。瓶子上的标签显示了 D,这可能是 Baekseju ...
腾讯网
19 天
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
新智元 on MSN
1 天
打破RLHF瓶颈,克服奖励欺骗!Meta发布全新后训练方式CGPO,编程水平 ...
编辑:LRST 【新智元导读】CGPO框架通过混合评审机制和约束优化器,有效解决了RLHF在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型在多任务环境中的表现。CGPO的设计为未来多任务学习提供了新的优化路径,有望进一步提升大型 ...
腾讯网
17 天
千万别给科学家擦黑板
相传,当罗马士兵闯入古希腊数学家、天文学家和物理学家阿基米德家中并将其杀害时,他最后的要求是“别碰我的圆”。活跃于公元1世纪的作家瓦列里乌斯·马克西姆斯(Valerius Maximus)在其著作《善言懿行录》(Deeds and sayings ...
13 天
京东苹果双11大促!iPhone 16系列优惠500元:还送1年AppleCare
同时, 购买iPhone 16和iPhone 16 Plus还能再免费赠送1年期AppleCare ,分别价值649元和799元, iPhone 16 Pro和iPhone 16 Pro Max不赠送,但可享 99元得AppleCare 优惠。
来自MSN
12 天
上交大发布首个OpenAI o1复现项目进展报告,满满的经验洞察
团队介绍:本项目的核心开发团队主要由上海交通大学 GAIR 研究组的本科三年级、四年级学生以及直博一年级研究生组成。项目得到了来自 NYU 等一线大型语言模型领域顶尖研究科学家的指导。
15 天
罗技荣登福布斯2024年全球最佳雇主榜单第20位
值得注意的是,罗技 首次 进入榜单前 200 名,就取得了第 20 位的佳绩,在全球同产业公司中位列前6,这在福布斯看来是一项“惊人的成就”。此外,罗技还被评为 2021 年 最佳 女性友好型雇主第 118 ...
9 天
on MSN
SSC GD Syllabus 2025, Download Constable Syllabus PDF
SSC GD Syllabus 2025 plays an important role in the preparation of the candidates. Familiarity with the syllabus is of utmost ...
16 天
Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子
Meta版o1也来了。 田渊栋团队带来新作Dualformer,把快慢思考无缝结合,性能提升还成本更低。 能解决迷宫、推箱子等复杂问题。 通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。 由此能形成更简洁的思维链(CoT)。 从结果来看,在慢思考模式下,Dualformer的最优解率达到97.6%,推理步骤减 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈