0403
2025-04-03 08:41:00

OpenAI发布AI科研复现基准测试PaperBench

当地时间 4 月 2 日,美国开放人工智能研究中心(OpenAI)宣布推出 PaperBench,这是一个用于评估 AI 智能体复现前沿 AI 研究能力的全新基准。PaperBench 要求智能体从零开始复现 20 篇 ICML 2024 Spotlight 和 Oral 论文,过程包括深入理解论文贡献、开发代码库以及成功执行实验。

OpenAI 在 PaperBench 上对多个前沿模型进行测试后发现,表现最佳的智能体 Claude 3.5 Sonnet(新版)结合开源框架,平均复现得分达到 21.0%。不过,OpenAI 招募顶尖机器学习博士尝试部分测试集后发现,上述模型表现尚未超越人类基线。

下一篇特朗普宣布 “对等关税”,对中国征收税率升至 34%
2025 年 4 月 2 日,特朗普在白宫签署两项 “对等关税” 行政令,美国将对 40 多个贸易逆差贸易伙伴设 10%“最低基准关税”,部分伙伴关税更高,最高达 49%。其中,中国被征收 34% 关税,在原有 20% 税率基础上加征后将达 54%;欧盟为 20%,越南高达 46% 。此外,美国还将对全球进口私家车及货车、进口汽车零件、进口啤酒及空铝罐分别征收 25% 关税,且生效时间不一。这一举措引发广泛关注,此前多个贸易伙伴已表明将采取反制措施,全球贸易格局或因之发生重大变化。
免费下载
免费下载
小程序
小程序
小程序
交流群
交流群
交流群
回顶部