当前位置:首页 > 热点关注 > 正文内容

GPT-5基准图错误遭全网吐槽 直播小bug引发热议

3周前 (08-08)热点关注21

   GPT-5基准图错误遭全网吐槽 直播小bug引发热议!等了多年的 GPT-5 终于在一个凌晨发布了。直播中,OpenAI 的几位核心人员显得非常紧张,奥特曼在直播过程中连发十几条推特介绍 GPT-5 的特点。

  

   GPT-5 是一个集成模型,用户不需要在不同模型之间切换,它会自己决定何时需要深入思考。尽管奥特曼强调基准测试不重要,但他们还是公布了一些跑分结果:数学领域 AIME 测试达到 94.6%;实际编程应用 SWE-bench Verified 达到 74.9%热点话题热点话题,Aider Polyglot 达到 88%;多模态理解 MMMU 达到 84.2%;健康领域 HealthBench Hard 达到 46.2%。通过 GPT-5 Pro 的扩展推理能力,该模型还在 GPQA 测试中创造了新的 SOTA,得分 88.4%。

  

   费用方面,GPT-5 分为免费版、Plus 和 Pro 计划。免费版也能使用带推理功能的 GPT-5 普通版,Plus 用户在使用频率上限制更少,而 Pro 用户可以使用 GPT-5 Pro。面向开发者,标准版 GPT-5 API 价格为每百万输入 Token 1.25 美元,每百万输出 Token 10 美元,GPT-5 mini 版和 Nano 版则更便宜。

  

   直播中,OpenAI 展示了 GPT-5 在教育、写作、编程、语音等多个方面的应用。例如,在教育方面,它可以生成数百行代码并解释复杂概念;在写作方面,GPT-5 的文笔比 GPT-4 更好;在编程方面,它可以在几分钟内创建一个法语学习网页;语音模式也得到了升级,更适合学外语。此外,GPT-5 还优化了“AI 看病”功能,并请了一位癌症患者分享她的经历。GPT-5基准图错误遭全网吐槽 直播小bug引发热议 GPT-5基准图错误遭全网吐槽 直播小bug引发热议

相关文章

永辉超市“反向抹零”引争议 消费者权益受损

   永辉超市“反向抹零”引争议 消费者权益受损!近日,重庆永辉超市金源时代店被曝出“反向抹零”的行为。消费者刘先生购买了标价为7.96元的淡虾米(二级),支付100元现金后,超市实际收取...

钢铁大王遭绑儿子被嫌犯甩锅是主谋 警方称缺乏证据

   菲律宾华人钢铁大王郭从愿遭绑架并被撕票的案件出现了新的转折。一名涉案嫌疑人声称,此案的主谋是郭从愿的儿子郭荣贤。然而,警方表示目前缺乏足够的证据支持这一说法。案件仍在进一步调查中。...

《动画大放映》 20250501 20:05

   本期节目主要内容: 大头儿子在小小航天员选拔赛中屡屡受挫,为了鼓励和引导儿子,小头爸爸假扮外星人担任秘密教练。大头儿子逐渐理解了航天精神,关键时刻舍小我为大家,得到了伙伴们的认可,成...

“现在全国高速路上有超过4500万辆车”

   来源:央视网 更新时间:2025年05月02日 08:07 视频简介 正值五一长假,交通运输部数据显示,“现在全国高速路上有超过4500万辆车在运行”。 更多 > “现在全国...

女子回应拿“柴米油盐酱醋茶”当喜糖 实用浪漫两不误

女子回应拿“柴米油盐酱醋茶”当喜糖 实用浪漫两不误

   “五一”小长假是婚礼举办的高峰期,不少年轻人选择将婚礼“喜糖”换成“柴米油盐酱醋茶”,既实用又富有生活气息。在社交平台上,许多新人晒出精心包装的实用版“喜糖”,网友形容这是“菜篮子”...

江西已开启人海模式 “五一”出游人气旺

江西已开启人海模式 “五一”出游人气旺

   “五一”假期,江西迎来了旅游热潮。不少知名景区开启了“人山人海”模式,江西省博物馆和美术馆都挤满了游客。在八一广场,来自全国各地的游客和市民朋友齐聚一堂,共同见证五星红旗冉冉升起,感...