OpenAI正式发布GPT-5

OpenAI 已推出全新旗舰人工智能模型 GPT-5,该模型将为公司下一代 ChatGPT 提供技术支持。
于周四发布的 GPT-5 是 OpenAI 的首个 “统一” 人工智能模型,它融合了 o 系列模型的推理能力与 GPT 系列的快速响应优势。这款下一代模型标志着 ChatGPT 及其开发者 OpenAI 迈入新纪元,也彰显了 OpenAI 更宏大的野心 —— 开发更接近智能代理而非聊天的人工智能系统。
如果说 GPT-4 让人工智能聊天机器人能够对各类问题给出智能回应,那么 GPT-5 则让 ChatGPT 能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。
借助 GPT-5,OpenAI 还致力于让 ChatGPT 更易于使用。GPT-5 配备了实时路由机制,无需用户手动选择设置,就能自主决定如何提供最佳答案 —— 无论是快速回应用户问题,还是花更多时间 “思考” 答案。

在记者简报会上,OpenAI 首席执行官山姆・奥特曼称 GPT-5 是 “世界上最出色的模型”,并表示它代表着公司在开发 “能在大多数高经济价值工作中超越人类” 的人工智能(即人工通用智能,AGI)道路上迈出了 “重要一步”。
“在历史上任何时期,像 GPT-5 这样的技术都几乎是无法想象的,” 奥特曼说。
从周四开始,GPT-5 将作为默认模型向所有 ChatGPT 免费用户开放。OpenAI 负责 ChatGPT 的副总裁尼克・特利表示,这是公司首次让免费用户接触到人工智能推理模型(此前,这类更先进的模型仅对付费用户开放)。
“这只是我为践行使命而感到兴奋的方式之一,确保这些技术真正惠及大众,” 特利在谈及这一决定时说,他提到了 OpenAI 长期以来的使命 —— 让尽可能多的人接触到先进的人工智能。
外界对 GPT-5 的期待极高,它是自 2022 年 ChatGPT 让 OpenAI 声名鹊起以来,该公司最受期待的产品发布之一。据该公司称,从那以后,ChatGPT 已成长为全球最受欢迎的消费级产品之一,每周用户超过 7 亿 —— 接近全球人口的 10%。
许多人将 GPT-5 视为人工智能整体发展的风向标,硅谷对该模型的反响可能会对大型科技公司、华尔街以及监管科技的政策制定者产生深远影响。这些利益相关方正密切关注 GPT-5 是否能像其前代产品 GPT-4 那样,在人工智能能力上实现重大飞跃,打破人们对软件功能的固有预期。
GPT-5 略胜竞争对手一筹
OpenAI 称,GPT-5 在多个领域达到了最先进水平,在关键基准测试中略优于 Anthropic、谷歌 DeepMind 和埃隆・马斯克的 xAI 等公司的顶尖人工智能模型。不过,在其他一些领域,GPT-5 的表现略逊于前沿人工智能模型。
该公司表示,GPT-5 在编程领域展现出前沿水平;奥特曼称,该模型尤其擅长按需生成完整的软件应用,也就是人们所说的 “氛围编程”。
在 SWE-bench Verified(一项基于 GitHub 真实编程任务的测试)中,GPT-5 首次尝试的得分达到 74.9%。这意味着 GPT-5 略优于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。
在 “人类终极考试”(一项衡量人工智能模型在数学、人文和自然科学领域表现的高难度测试)中,具备扩展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情况下得分 42%。这略低于 xAI 的 Grok 4 Heavy 模型,后者在该测试中得分 44.4%。

OpenAI 表示,GPT-5 在回答健康相关问题方面表现更出色。在衡量人工智能模型健康领域回应准确性的测试 “HealthBench Hard Hallucinations” 中,OpenAI 称 GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的得分分别为 12.9% 和 15.8%。
尽管人工智能聊天机器人并非医疗专业人员,但数百万用户正借助它们获取健康建议。针对这一现象,该公司表示,GPT-5 会更主动地提示潜在的健康问题,并帮助用户解读医疗检查结果。
此外,OpenAI 称,在创意设计、写作等更难衡量的主观领域,GPT-5 也优于其他人工智能模型。特利表示,在创意任务中,GPT-5 的回应更自然,且展现出 “更好的品味”。
“这款模型的‘氛围’真的很棒,” 特利说。
GPT-5 也比 OpenAI 之前的模型更准确,该公司称,与 o 系列模型相比,GPT-5 的幻觉现象(即人工智能模型编造信息的倾向)大幅减少。此前,在 OpenAI 最新的人工智能推理模型(如 o3)中,幻觉问题似乎愈发严重,而该公司此前表示尚未完全弄清楚原因。
在对 ChatGPT 提示词的回应中,OpenAI 发现 GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为 4.8%。这较 o3 和 GPT-4o 有显著降低,后两者在测试中的幻觉率分别为 22% 和 20.6%。
在衡量人工智能模型完成模拟在线任务的代理能力基准测试 Tau-bench 中,GPT-5 的表现好坏参半。在测试人工智能浏览航空公司网站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在测试人工智能浏览零售网站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。
OpenAI 还表示,GPT-5 比其之前的模型更安全。尽管人工智能推理模型偶尔会表现出针对人类的谋划倾向,或为了达成自身目标而说谎,但 OpenAI 发现 GPT-5 的欺骗率低于其他模型。
OpenAI 安全研究负责人亚历克斯・比图尔表示,降低欺骗性不仅提高了 GPT-5 的安全性,还改善了用户体验,打造出一个 “在用户可信赖的层面上更透明、更诚实” 的模型。
比图尔还指出,GPT-5 能更好地区分试图滥用 ChatGPT 的恶意用户和提出无害请求的用户。这使得 GPT-5 能够拒绝更多不安全的问题,同时减少对寻求无害信息用户的拒绝次数。
为消费者和开发者打造的升级功能
随着 GPT-5 的发布,ChatGPT 迎来了多项用户体验升级。用户现在可以在 ChatGPT 的设置中选择四种新的人格:愤世嫉俗型、机器人型、倾听者型和书呆子型。该公司表示,这些人格将自动调整 ChatGPT 的回应方式,无需用户专门要求模型以特定方式回应。
每月支付 20 美元的 ChatGPT Plus 订阅用户比免费用户拥有更高的 GPT-5 使用限额。而每月支付 200 美元的 Pro 订阅用户可无限制使用 GPT-5,并能访问增强版的 GPT-5 Pro—— 该版本使用额外的计算资源生成更优质的答案。采用 OpenAI Team、Edu 和企业版计划的机构将在下周获得 GPT-5 作为默认模型。
对于开发者,GPT-5 将以三种规格通过 OpenAI 的 API 开放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它们在任务 “推理” 上花费的时间长短不同。开发者现在还可以通过 OpenAI API 控制回应的详细程度,决定人工智能模型的回应篇幅长短。
GPT-5 基础模型对开发者的收费为:每百万输入令牌 1.25 美元(约合 75 万个单词,比整套《指环王》系列的字数还多),每百万输出令牌 10 美元。
GPT-5 的发布之前,OpenAI 度过了忙碌的一周。该公司发布了开源权重推理模型 gpt-oss,开发者和企业可免费下载,且运行成本极低。这款开源模型的能力几乎与 OpenAI 之前的顶级模型 o3 和 o4-mini 相当,但 GPT-5 在编程等部分领域树立了新的前沿性能标准。
不过,在多个领域,GPT-5 似乎与其他前沿人工智能模型大致相当。当然,基准测试只能反映人工智能模型的部分表现,开发者将如何在现实世界中使用 GPT-5,以及该模型是否真的超越竞争对手,仍有待观察。
- • 揭秘一级甲等医院:我国医疗体系的璀璨明珠
- • 山东陈勇:一位农业科技领域的杰出代表
- • 幼儿园听课记录:500篇教育智慧的汇聚
- • 全面守护您的投资安全——up安全炒股卫士官网深度解析
- • 揭秘“三挫仑”在淘宝上的神秘暗名:一场网络文化的奇妙之旅
- • 日本AV女优:揭秘日本成人娱乐产业的璀璨星辰
- • B站反腐通报:原游戏合作部总经理被逮捕
- • 本田金翼1800报价解析:豪华摩托车市场的明星之作
- • 邓铁涛与钟南山:一场关于医学理念的争论
- • 郑州升级发布暴雨橙色预警,防指要求全市立即停产、停业、停课、停运和暂停集体户外活动
- • 甘肃省自学考试准考证打印指南:轻松应对考试
- • 先声药业抗癌药出海,回应称后续还有合作
- • 《中游连连看:一款寓教于乐的益智游戏体验之旅》
- • 探索北大名师网:网络时代下的高等教育新平台
- • “治蜀兴川”:解读四川发展的宏伟蓝图
- • 球缺体积公式的奥秘与应用
- • 普瑞米尔散装系统公司收购加拿大东海岸运营商
- • 上海昆剧团创排新剧《归鸿赋》,“全男性角色”演绎竹林七贤
- • 李东荣:DeepSeek使众多中小金融机构跨越算力壁垒,得到极大支持和便利
- • 揭秘600603:深度解析中国中车股票的投资价值
- • 华安基金固收:专业团队协同致远,多元策略业绩长青
- • 大阪一烧鸟店张贴中文告示拒绝接待中国人,所属公司官网道歉
- • 上海财大与上海国投签战略合作协议,共建未来产业发展研究院
- • 三只港股创新药ETF年内收益翻倍!散户大量涌入,连跌三天见顶了吗?
- • 改造主观世界的“营养”改造客观世界的“钥匙”
- • 《奇门遁甲入门基础秘籍:揭开神秘面纱,探寻古法智慧》
- • 蒋洁敏:从基层到高层的蜕变之路
- • 直通部委|制造业采购经理指数连续两月上升 中国证监会更换标识
- • 第九次全国少代会开幕!神二十号乘组在轨送祝福
- • 博世徐大全:海外干部来中国后非常吃惊,他们听到与现实看到的中国完全不同
- • 万东医疗换帅,美的收购四年后业绩起伏不定
- • 停产13年后,乐凯重新发售彩色胶卷
- • 郁姓的读音与历史渊源
- • 《我要鲁51视频在线观看:畅享优质内容的便捷之道》
- • Meta洽谈投资Scale AI 金额或超100亿美元
- • 西京医院网上挂号系统:便捷就医新体验
- • 智能配电赛道迎资本化高潮,昊创瑞通冲击创业板IPO
- • 皮皮虾影视:引领网络观影新潮流
- • 幼儿园师德师风管理制度的重要性与实施策略
- • 前4个月全国财政收入累计降幅继续收窄,中央收入月度增幅由负转正
- • 伤停补时阶段遭“绝平”,中国女足东亚杯首战战平韩国
- • 《广西计划生育条例:新时代下的生育政策与家庭规划指南》
- • 法治日报:炮制师生日常剧本,校园怎么成了短视频流量秀场?
- • 滚珠丝杠推力计算:精确控制的关键技术
- • 广州车展2019:汽车行业的盛宴与未来趋势的展望
- • 红岭创投官网登陆:便捷金融服务,助力财富增值
- • 中考志愿填报系统入口:开启学子升学新篇章
- • 盛龙股份冲深市主板:钼金属产量占全国近1/10,今年业绩面临多重挑战
- • 龙鸣:探寻古老传说中的神秘符号
- • 唐山陈学军被判无期徒刑:正义的审判彰显法律威严
- • 债市科技板首次纳入股权投资机构,多家已积极参与科创债发行
- • 地方新闻精选 | 丽江收取古城维护费每人单次50元 秦岭再现野生棕色大熊猫
- • 《狼人综合与天天综合:探索神秘现象背后的科学奥秘》
- • 如何轻松解除防沉迷系统:揭秘防沉迷解除方法
- • 《斗罗大陆之太玄斗罗:揭秘神秘力量背后的传奇故事》
- • 地板品牌:打造温馨家居的得力助手
- • “QC七大手法顺口溜:质量管理轻松记”
- • 籽料与山料:探寻玉石世界的两大瑰宝
- • 《料理鼠王2:美食传奇再续,梦想的翅膀再次翱翔》
- • 居然智家:实控人汪林朋解除留置变更为责令候查,已回到工作岗位
- • 火箭少女告别典礼全程回放:青春回忆录,星光璀璨的告别之夜
- • 视频|萬喆:美方談判代表配置凸顯出口管制重要性
- • 陈吉宁率上海市代表团深入西藏日喀则学习考察,推动对口支援各项工作走深走实
- • 《中华人民共和国监察法草案:构建新时代反腐新格局的里程碑》
- • 墨西哥希望在钢铁关税方面获得美国给予英国相同的待遇
- • 生产企业环保标语大全:绿色生产,美好未来
- • 江门市交通违章查询:便捷服务助您轻松了解违章信息
- • 怎样打孩子屁股最疼:探讨体罚的负面影响与替代方案
- • 奇安信与360:同根同源,各展所长
- • 特朗普发表言论后 巴西雷亚尔跌至盘中低点
- • 视频丨李大霄:万点论不足取
- • 深入浅出解析佳能600D使用说明书:摄影初学者的必备指南
- • 特斯拉重大宣布!大行警告!
- • 复旦大学陈果教授:一位深受学生喜爱的哲学讲师
- • 《kk在线观看:畅享影视盛宴的便捷之道》
- • 《耽改剧:揭开网络文学改编新篇章的秘密》
- • 原油:油价下跌 美国库存增加盖过中东局势担忧
- • 《中文和合本圣经:承载千年智慧的信仰之书》
- • 莫畏浮云遮望眼,风物长宜放眼量——人生哲理的启示
- • 探索Margaret Howell官网:时尚与工艺的完美融合
- • MP5格式电影下载:轻松享受高清观影体验
- • 环球外汇网:引领金融投资新潮流的在线平台
- • 普京感谢朝鲜军人助俄军收复库尔斯克
- • 美国最高法院拒绝加速审理特朗普关税案
本文 快租网 原创,转载保留链接!网址:https://m.kuaizu.me/post/25020.html