GPT-5上线遭“滑铁卢”!OpenAI宣布:重新上线GPT-4o!奥尔特曼发声
8月8日,ChatGPT-5上线后,不少用户发现OpenAI停用GPT-4o版本,引发巨大争议。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼“还我GPT-4o”。
面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用“显示旧版模型”访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。
OpenAI首席执行官萨姆・奥尔特曼同样在X平台上连发两条推文,回复下线GPT-4o与GPT-5上线带来的争议。
奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。
针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。
奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。
用户对GPT-5的“吐槽”,主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。
据每日经济新闻,在8月7日的发布会上,奥尔特曼曾用三个生动的身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的“博士级专家”,能够随时助力用户达成各种复杂目标。
OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。
为了减少备受诟病的“幻觉”问题,GPT-5还引入了更严格的事实核查与内容过滤机制。具体来看,在联网搜索时,GPT-5的事实错误概率比GPT-4o低约45%;独立思考时,出错概率比o3模型低约80%;在开放式事实性基准测试中,产生“幻觉”的数量更是比o3模型少了约六分之五。
OpenAI在发布会上特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。
Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:“GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。”但他随即话锋一转:“然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。”
从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。
“GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。”AI营销与销售专家、太和智库研究员唐兴通在接受每经记者采访时分析指出,“我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。”
他认为,AI的发展正面临两大物理限制:“我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。”
作者:秦天宝(武汉大学环境法研究所所长)2023年11月,中央全面深化改革委员会第三次会议审议通过了《关于全面推进美丽中国建设的意见》《关于加强生态环境分区管控的指导意见》等重要文件。习近平 新华社记者戴小河与年前寒潮相比,龙年的第一轮寒潮降温幅度更大、低温持续时间更长、冻雨影响范围更广、南方降雨更强。多地气温“俯冲式”下跌,供暖供电需求攀升。煤、电、气等能源行业积极应对,全天候 新华社记者王自宸、宋立崑、侯文坤受大范围低温雨雪冰冻天气影响,至22日5时,湖北省绝大部分市县出现1至9厘米积雪。湖北省应急部门于22日10时将低温雨雪冰冻灾害应急响应由四级提升至三级。湖北各地各 中国经济导报 中国发展网讯 春风送暖促就业、精准服务助发展。2月21日,甘肃礼县举行2024年春风行动·东西部劳务协作招聘会暨“礼贤妹”“礼贤大嫂”赴京务工欢送仪式,来自省内外26家人力资源服 “药械同追”试点项目助力医疗产品追溯标准化 近日,全国首个GS1“药械同追”试点项目顺利通过中国物品编码中心的验收。该项目是以国际通用的GS1编码标准为基础建设的“药械同追”平台系统,可同时满足我国药品追 “十四五”前三年江西省单位工业增加值能耗预计下降约8% 中新网南昌2月22日电 (朱莹)22日,江西贯彻实施《江西省人民代表大会关于全力打造国家生态文明建设高地的决定》(以下简称《决定》)座谈会在南昌召开。记 。本文链接:GPT-5上线遭“滑铁卢”!OpenAI宣布:重新上线GPT-4ohttp://www.sushuapos.com/show-5-64696-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。