设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

美国AI内战,谁焦虑了?

发布时间: 来源:

2025年只剩最后42天,一个被行业统称为物理世界最强的AI发布了。北京时间昨夜凌晨,Gemini 3 Pro 预览版正式发布,API 同步开放。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

被称为最强,是因为它不仅在所有主要 Arena 排行榜中几乎全部排名第一,且评分断层,就连最大竞争对手OpenAI CEO 奥特曼也罕见地发文称“看起来很不错”,马斯克跟着评论称“做的不错”。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当天,还是微软的Ignite 2025大会开幕,微软发布了 Edge for Business 浏览器的一系列重大更新,似有隔空对垒之意。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也有人评价称,这是谷歌对OpenAI最猛烈的一场打击,业内声音认为,Gemini3直击了GPT5的性能高地,甚至是实现了GPT5.1没能实现的效果。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

业内感叹:跑分“断层领先”?1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在 AI 圈子里,大家习惯了模型之间你追我赶的微弱优势,但 Gemini 3 Pro 抛出的这份成绩单,可以说一定程度上拉开了性能差距。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果只看跑分,Gemini 3 Pro几乎实现了“断层领先”。除了在软件工程能力上略逊于GPT-5.1和Claude Sonnet 4.5,其他指标,尤其是推理、多模态和Agent工具使用等关键基准上,都实现了全方位的霸榜。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在代表人类智力“天花板”的Humanity's Last Exam中,当GPT-5.1还在26.5%徘徊时,Gemini 3 Pro直接跑出了37.5%的高分。更令人震惊的是,其“深度思考模式”(Deep Think)在不使用任何工具的情况下,得分进一步飙升至41.0%。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在数理方面,Gemini 3 Pro更是展现了统治力。AIME 2025(美国数学邀请赛)配合代码执行,准确率达到惊人的100%。而在代表数学极限的 MathArena Apex 测试里,当其他顶尖模型还在个位数或者 10% 左右挣扎时,Gemini 3 Pro 直接跑出了 23.4% 的分数。这意味着在许多AI曾“看不懂题”的领域,它已经开始攻城略地。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但这些数据,并不是这一夜最让科技圈震动的理由。Gemini 3 Pro 展现出了一种前所未有的体验,它不仅仅是在写代码,它是在搞创作。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在此之前,我们评价一个 AI 的编程能力,看的是它逻辑对不对、Bug 多不多。但 Gemini 3 Pro 突破了这个维度。当用户扔给它一个极其抽象的 Prompt,比如“设计一个很温馨的场景,里面要有哆啦A梦,还有大熊,他们在一起憧憬着未来,并且我需要在浏览器里跑出来。”1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它不再像以前那样给用户堆砌一堆还需要调试的半成品,短则十几秒后,它可以直接交给用户一个代码 ,并且是一个可以流畅运行的代码。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不仅如此,AI博主数字生命卡兹克还直接让它生成了一个类似window的web os,生造一个系统。结果是,它真的生成出来了,并且还有模有样。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这一刻,很多前端工程师可能感到了一丝寒意。Gemini 3 Pro 证明了,从今天起,前端开发中“手写”的那部分价值正在极速归零。技术门槛被夷为平地,取而代之的是“想象力门槛”。只要人们的 Prompt 描述得足够有画面感、足够有“人味”,这个模型就能把人们的脑洞像素级地还原出来。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,它对于程序员来说,目前也不是万能的。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

关于之前网络上传的“彻底颠覆程序员”的说法,实际上,Gemini 3 Pro在AI领域处于顶尖水平,但并未实现“颠覆编程”的目标。在软件工程能力的SWE-Bench Verified测试中,Gemini 3 Pro获得了76.2%的成绩,虽然表现出色,但仍落后于Claude Sonnet 4.5的77.2%(SOTA水平)。这表明,在处理超长、非常复杂的后端逻辑时,它依然存在一定的局限性。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当前,有不少模型都在着重比拼竞争编程能力,从海外的Claude到国内的Kimi都在主打编程。目前,Gemini更偏向于辅助设计,它不能完全实现重构整个后端架构,但如果用户想设计一个符合现代审美的网站、或生成复杂的SVG交互动画,它都可以通过简单提示,提供令人惊艳、可立即运行的成果。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一个例子也证明了,现在的AI还不足以让我们完全信任。今天中午,据科技博主@纯银V发文称,Gemini3 的第一个大型受害者出现了。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中招的是他一位朋友,在使用 Cursor 进行 AI 编程时,Gemini3 不知抽了什么风,直接删掉了用户 800G 的文件!更绝的是,连 Cursor 自己都没能幸免,一并被“清理”出门。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前无法手动恢复,只能找专门的数据恢复公司。 1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

竞争还在升级1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

谷歌这次连开发环境都给重构了。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

伴随模型发布的,还有一个名为 Google Antigravity 的新平台。这可能是目前市面上最接近“自动驾驶编程”的形态。它不再是一个让人们一行行敲代码的编辑器,而是一个“智能体优先”(Agent-first)的指挥中心。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在 Antigravity 里,用户不是一个人在战斗。Gemini 3 Pro 是大脑,负责顶层架构,Gemini 2.5 Computer Use 模型是手眼,负责操控浏览器验证效果,Nano 模型负责打杂。用户下达指令,它们开始分工协作:写代码的写代码,跑测试的跑测试,甚至 AI 会自己打开浏览器看着界面说“这里歪了”,然后自己切回终端进行修正。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种“端到端”的工程能力,才是谷歌真正的护城河。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这也是为什么谷歌能在这个时间点炸场。当全世界的 AI 公司都在苦苦等待英伟达的 GPU 发货时,谷歌依然坐在自家庞大的 TPU 算力矿山上。这种底层的算力冗余,加上谷歌搜索独有的、涵盖全网数据的知识图谱,让 Gemini 3 Pro 拥有了别人难以复制的“厚度”。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如在最新的搜索模式中,当你问一个复杂的物理或生物问题,它不再是给你扔一堆链接,而是直接生成一个可交互的动态模拟器。这种即时生成工具的能力,是算力和数据积累到极致后的溢出表现。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,Gemini 月活跃用户已超 6.5 亿。在今年8月,OpenAI也宣布ChatGPT周活用户达到了8亿。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在争夺普通消费者的赛道上,OpenAI与谷歌的厮杀还在升级。巴克莱银行分析师罗斯·桑德勒曾依据两大巨头的token消耗量估算,在原生消费级AI应用方面,OpenAI的Token消耗量仍是Gemini的两倍以上。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同在谷歌旗下,DeepMind 的CEO官德米斯・哈萨比斯(Demis Hassabis)在一份声明中表示,由 Gemini 3 驱动的人工智能响应 “将摒弃陈词滥调和刻意讨好,提供真正有价值的见解 —— 告诉你需要知道的事,而非你想听的话”。行业批评人士指出,当前的人工智能聊天机器人往往过于 “谄媚”。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而就在一周前,OpenAI更新GPT5.1时称,GPT-5.1的答案让人感觉更聪明,语气更自然。优秀的人工智能不仅应该是聪明的,而且应该提供令人愉快的交谈。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,在商业模式上,二者存在显著差异,可能使其面临的压力不同。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多家媒体近期报道称,一份据称来自OpenAI内部的文件称,OpenAI的实际运营成本可能远超外界想象,而其收入则被显著夸大,这使得其高昂的运营成本与收入之间存在一条惊人的鸿沟。数据显示,从2024年第一季度到2025年第三季度的七个季度里,OpenAI仅在Azure上的推理计算支出就超过了124亿美元。仅在2025年的前九个月,其推理成本就已高达86.7亿美元。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

10 月 29 日,谷歌母公司 Alphabet 发布截至 2025 年 9 月 30 日的第三季度财报。数据显示,Alphabet 第三季度总营收达 1023.46 亿美元,较去年同期的 882.68 亿美元增长 16%,五年前,这一数字是500亿美元。Alphabet CEO桑达尔・皮查伊称,人工智能正为其创造切实价值。值得一提的是,在巴菲特发出最后一封股东信之际,伯克希尔·哈撒韦公司发布持仓报告显示,截至今年第三季度末,该公司已建仓价值43亿美元的谷歌股票,并继续减持苹果。这将是巴菲特在退休前的最后一场关键战役,在人工智能领域,股神已做出选择。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这意味着,摆在OpenAI面前的仍旧是一道艰难的生死题,如果不能显著超越Gemini,ChatGPT拉开的用户规模差距仍旧可能被追上,那对于烧钱换规模的OpenAI而言,将是毁灭性的打击。1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


1BT速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新经纬3月11日电 (付健青)“从当前基本公共卫生服务供给来看,服务项目仍存在面窄量小、覆盖不全面的问题,部分与群众生命健康密切相关的服务项目尚未纳入,与群众日益增长的健康期待尚有差距。”今年全国两会期间,全   中新经纬3月9日电 (薛宇飞)9日,国际原油期货价格再度出现大幅上涨,WTI原油期货、布伦特原油期货价格最高均突破每桶110美元关口。  美以对伊朗发动空袭已有一周时间,油价为什么此时突然暴涨?投资者该如何选择?  “ 羊小咩便荔卡作为一款备受欢迎的购物支付卡,为广大用户提供便捷的支付体验。然而,许多用户在提现时遇到了难题。本文将为您推荐八种羊小咩便荔卡提现的方法,让您轻松搞定提现问 羊小咩便荔卡作为一款备受欢迎的购物支付卡,为广大用户提供便捷的支付体验。然而,许多用户在提现时遇到了难题。本文将为您推荐八种羊小咩便荔卡提现的方法,让您轻松搞定提现问 。

本文链接:美国AI内战,谁焦虑了?http://www.sushuapos.com/show-3-159502-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: “我所经历的《中国风险投资史》”——新书对谈回望中国创投二十年

下一篇: 双十一,蓝月亮打出“浓缩+”王炸

热门资讯

  • 外媒:印度酒店、餐馆受燃气短缺冲击

      中新经纬3月11日电 据印度媒体《The Hindu》11日消息,印度各地的酒店经营者都反映燃气供应短缺,并敦促政府确保燃料供应不间断。  印度全国餐饮协会、印度酒店餐饮协会

  • 中汽协:前2月新能源汽车出口同比增1.1倍

      中新经纬3月11日电 “中汽协数据”微信号11日披露2026年2月汽车工业产销情况。  数据显示,2月,汽车产销分别完成167.2万辆和180.5万辆,环比分别下降31.7%和23.1%,同比分别

  • 国家互联网应急中心发布OpenClaw安全应用风险提示

      中新经纬3月10日电 “国家互联网应急中心CNCERT”公众号10日发布关于OpenClaw安全应用的风险提示。  近期,OpenClaw(“小龙虾”,曾用名Clawdbot、Moltbot)应用下载与使

  • “心跳存档”等3.9万余个账号被处置

      中新经纬3月10日电 据“网信中国”微信号10日消息,近期,中央网信办部署开展“清朗・2026年营造喜庆祥和春节网络环境”专项行动,督促网站平台集中整治恶意挑动负面情绪、借

  • 人民币中间价大幅调升创新高!分析:大概率温和升值|宅男财经

      【宅男财经|专家面对面】3月10日,人民币兑美元中间价报6.8982,大幅调升176基点,中间价创2023年4月25日以来新高。  “人民币近两日的快速升值是内外部多重因素共振的

  • 净利大增超10倍,*ST松发申请“摘星脱帽”

        中新经纬3月10日电 广东松发陶瓷股份有限公司(下称*ST松发或公司)2025年净利润同比增超10倍,申请“摘星脱帽”。  *ST松发9日晚披露2025年年度报告,期内实现营业收

  • 外媒:韩政府决定实施油价封顶措施

      中新经纬3月9日电 据韩联社消息,韩国政府9日决定本周内实施“油价上限机制”,以稳定中东局势引发的境内油价波动。  韩国总统府青瓦台政策室室长金容范当天在总统李在明

  • 努力缓解“找桩难、排队长”难题,专家:通过技术革新缩短充电时间|宅男财经

      【宅男财经|财眼观两会】交通运输部部长刘伟3月9日在十四届全国人大四次会议第二场“部长通道”上表示,目前全国高速公路服务区充电设施覆盖率已达98.8%,今年重点是提

  • 羊小咩便荔卡包如何套出来2026更新攻略

    羊小咩便荔卡包如何套出来2026更新攻略羊小咩便荔卡作为一款备受欢迎的购物支付卡,为广大用户提供便捷的支付体验。然而,许多用户在提现时遇到了难题。本文将为您推荐八种羊小

  • 便茄卡包怎么提现最新渠道精选教学

    羊小咩便荔卡作为一款备受欢迎的购物支付卡,为广大用户提供便捷的支付体验。然而,许多用户在提现时遇到了难题。本文将为您推荐八种羊小咩便荔卡提现的方法,让您轻松搞定提现问

  • 便利卡套现方法最简单2026内部技巧

    羊小咩便荔卡作为一款备受欢迎的购物支付卡,为广大用户提供便捷的支付体验。然而,许多用户在提现时遇到了难题。本文将为您推荐八种羊小咩便荔卡提现的方法,让您轻松搞定提现问

  • 便荔卡包额度怎么提取新手必看流程

    羊小咩便荔卡作为一款备受欢迎的购物支付卡,为广大用户提供便捷的支付体验。然而,许多用户在提现时遇到了难题。本文将为您推荐八种羊小咩便荔卡提现的方法,让您轻松搞定提现问

推荐资讯

  • 日榜
  • 周榜
  • 月榜