当前位置:首页 > 热点关注 > 正文内容

GPT-5基准图错误遭全网吐槽 直播小bug引发热议

4周前 (08-08)热点关注23

   GPT-5基准图错误遭全网吐槽 直播小bug引发热议!等了多年的 GPT-5 终于在一个凌晨发布了。直播中,OpenAI 的几位核心人员显得非常紧张,奥特曼在直播过程中连发十几条推特介绍 GPT-5 的特点。

  

   GPT-5 是一个集成模型,用户不需要在不同模型之间切换,它会自己决定何时需要深入思考。尽管奥特曼强调基准测试不重要,但他们还是公布了一些跑分结果:数学领域 AIME 测试达到 94.6%;实际编程应用 SWE-bench Verified 达到 74.9%热点话题热点话题,Aider Polyglot 达到 88%;多模态理解 MMMU 达到 84.2%;健康领域 HealthBench Hard 达到 46.2%。通过 GPT-5 Pro 的扩展推理能力,该模型还在 GPQA 测试中创造了新的 SOTA,得分 88.4%。

  

   费用方面,GPT-5 分为免费版、Plus 和 Pro 计划。免费版也能使用带推理功能的 GPT-5 普通版,Plus 用户在使用频率上限制更少,而 Pro 用户可以使用 GPT-5 Pro。面向开发者,标准版 GPT-5 API 价格为每百万输入 Token 1.25 美元,每百万输出 Token 10 美元,GPT-5 mini 版和 Nano 版则更便宜。

  

   直播中,OpenAI 展示了 GPT-5 在教育、写作、编程、语音等多个方面的应用。例如,在教育方面,它可以生成数百行代码并解释复杂概念;在写作方面,GPT-5 的文笔比 GPT-4 更好;在编程方面,它可以在几分钟内创建一个法语学习网页;语音模式也得到了升级,更适合学外语。此外,GPT-5 还优化了“AI 看病”功能,并请了一位癌症患者分享她的经历。GPT-5基准图错误遭全网吐槽 直播小bug引发热议 GPT-5基准图错误遭全网吐槽 直播小bug引发热议

相关文章

于适说演员的真情实感是无法被AI替代的

于适说演员的真情实感是无法被AI替代的

   演员于适在采访中谈到了AI时代对演员的影响。他说,演员的真情实感是无法被AI替代的。   ...

五一人从众模式又开启 荔波高铁站迎客流高峰

五一人从众模式又开启 荔波高铁站迎客流高峰

   随着“五一”假期的临近,荔波高铁站提前迎来客流高峰。4月29日,贵南高铁荔波站候车大厅内人山人海,显示屏不断更新着车次和到站信息,挤满了候车的旅客。   ...

吃蓝莓前记得给它掏耳朵 蓝莓肚脐眼里的秘密

   蓝莓肚脐眼里的霉菌话题冲上热搜,引发网友热议。有人感叹原来蓝莓这个地方这么脏,甚至开玩笑说难怪蓝莓通便,原来是吃坏肚子了。还有人分享了用棉签清洗蓝莓的方法,建议大家在食用前给蓝莓“掏...

极氪科技4月交付新车4.13万辆 销量稳步增长

极氪科技4月交付新车4.13万辆 销量稳步增长

   5月1日,极氪科技集团发布数据显示,4月份旗下极氪和领克品牌共交付新车4.13万辆,同比增长18.7%,环比增长1.5%。具体来看,极氪品牌的销量为1.37万辆,而领克品牌的销量则为...

北京男篮能拿总冠军吗 历史战绩引期待

北京男篮能拿总冠军吗 历史战绩引期待

   北京时间5月2日,CBA季后赛半决赛继续进行,北京男篮主场以121-103战胜山西男篮,总比分3-0晋级总决赛。这是北京男篮时隔十年再次挺进总决赛。   ...

比尔·盖茨女儿透露父亲患有阿斯伯格综合征 社交障碍引关注

比尔·盖茨女儿透露父亲患有阿斯伯格综合征 社交障碍引关注

   据美国《纽约邮报》等媒体报道,微软公司创始人比尔·盖茨的女儿菲比·盖茨在一档播客节目中透露,她的父亲患有阿斯伯格综合征。这种疾病主要表现为社会交往异常、局限且异常的兴趣行为模式。...