设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

发布时间: 来源:

  谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手机和聊天机器人Bard。Gemini被视为对于AI(人工智能)新锐巨头OpenAI旗下最新大模型GPT-4的直接回应,也象征着一度因聊天机器人ChatGPT而处于被动状态的谷歌终于正式冲回赛道。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据谷歌介绍,Gemini在MMLU(大规模多任务语言理解)的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini将包括一套三种不同规模的模型,其中,Gemini Ultra被定位为GPT-4的竞争对手,Gemini Pro的性能优于GPT-3.5,Gemini Nano则用于特定任务和移动设备。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  凭借强大的性能,Gemini一夜爆红,引来了华尔街的关注。12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股价涨5.31%,收于136.93美元,迎来自今年8月29日以来表现最好的一天,总市值达到1.72万亿美元。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  美国银行的分析师在6日指出,由于人们对于谷歌的AI能力感到担忧,Alphabet今年承受了一定的压力,而一款“具有良好品牌形象的、竞争力较强的模型”可能会吸引更多消费者使用谷歌搜索,并对云服务的销售产生积极影响:“数据显示谷歌拥有一流的、不可复制的AI能力,这可能对公司在2024年上半年的股票走势产生积极影响。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  摩根大通的分析师在6日的一份报告中写道,尽管市场在当天没有对Gemini给出明显的反应,能够看到谷歌在“这一主要技术转变”中的进展还是十分“鼓舞人心”。然而,摩根大通也指出,大模型在“搜索领域的货币化路径存在不确定性”,可能会在未来带来一些阻力。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在7日的报告中,摩根大通的分析师写道:“虽然现在还处于其发展早期,但Gemini的推出象征着在生成式AI获得广泛商业化并得到广泛传播的第二年中,谷歌做出了重大创新。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  目前看来,谷歌如何在整体业务、尤其是最重要的搜索业务中将Gemini进行商业化是备受华尔街关注的一点。目前,谷歌计划在本月晚些时间通过谷歌云将Gemini授权给客户,并将在未来几个月与谷歌服务中的其他产品集成,但还没有公布后续的商业化策略。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  富国银行(Wells Fargo)的分析师表示,Gemini的推出应该足以平息关于“谷歌在AI领域究竟应该何去何从”的争论,不过,关键问题在于谷歌如何利用Gemini获得营利:“简而言之,我认为谷歌证明了他们仍然具有一些竞争力。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  而KeyBanc的分析师也表示,Gemini是谷歌今年众多AI公告的“顶峰”,但要让AI对谷歌的业绩增长和盈利能力产生积极影响需要时间:“Gemini仍在努力进入搜索等核心产品,因此我们建议耐心观察其影响。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  不同于华尔街的整体看好,在科技领域中有声音指出,Gemini或许存在“夸大宣传”的质疑。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在Gemini于6日推出后不久,就有网友指出了宣传资料中的一些不妥之处。例如,当谷歌称Gemini的MMLU的得分率高于GPT-4时,显示GPT-4的得分率是86.4%,但根据谷歌发布的60页技术报告,Gemini Ultra的MMLU测试结果下有“CoT@32”的小字注释,表示其使用了思维链提示技巧,尝试了32次并从中选择最好结果。而作为对比的GPT-4却是无提示词技巧给5个示例,在这个标准下,Gemini Ultra的测试结果其实是83.7%,低于GPT-4的86.4%。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如果是同样使用CoT@32的方法,虽然成绩仍低于Gemini Ultra,GPT-4的得分率达到了87.29%。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  如果像谷歌DeepMind首席科学家杰夫・迪恩(Jeff Dean)回应的那样,这种写法只是为了显示两种不同方法间的比较,对于Gemini测试视频的质疑则显得更加难以反驳。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在推出Gemini后,谷歌发布了一个时长六分钟的演示视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中,Gemini的反应速度都非常快,还会生成音频和图片来辅助回答,并用上一些口语化乃至幽默化的表达,可谓是让人大开眼界。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,很快就有网友从视频开篇的文字免责声明中发现了问题,认为其可能暗示了视频中展示的是精心挑选的好结果,不是实时录制,而经过剪辑的。随后,谷歌在一篇博客文章中解释了多模态交互过程,基本上也间接承认了只有使用静态图片和多段提示词拼凑,才能达成演示视频中的效果。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有分析指出,这和谷歌在视频中所暗示的可以说是完全不同,因为从视频看来,Gemini可以实时观察周围的世界并做出反应,用户可以与Gemini进行流畅的语音对话。沃顿商学院教授伊桑・莫利克(Ethan Mollick)也在X平台上进行了演示,如果是使用静态图片和多段提示词,完全可以通过ChatGPT Plus来复制Gemini的表现。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在质疑发酵后,谷歌DeepMind产品副总裁伊莱・柯林斯(Eli Collins)对外媒回应称,视频中的画鸭子演示(画一个鸭子的简笔画,Gemini可以对每一步骤做出正确的解释)确实是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔・维尼亚尔斯(Oriol Vinyals)也在X(原推特)平台上发布长文,解释了团队是如何制作该视频的:“视频中的所有用户提示和输出都是真实的,只是为了简洁而进行了缩短。”维尼亚尔斯还表示:“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  然而,维尼亚尔斯的回应引发了更多的争议。有网友评论道:“如果你想激励开发者,为什么不发布真实的内容呢?被缩短的用户提示就不算‘真实’。这样做既不真诚,又具有误导性。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有谷歌员工对外媒透露,他们认为这段视频描绘了一幅“不切实际的画面”。有员工表示,对这种夸张的演示并不感到惊讶,因为员工们已经习惯了公司会对产品在某种程度上进行夸大营销:“我认为大多数使用过大语言模型技术的员工都知道,要对(演示中的)这一切持保留态度。”eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  有外媒认为,谷歌“庞大的官僚体系和各级产品经理使其直到现在都无法像OpenAI那样敏捷地推出产品”。对于正在应对AI转型影响的社会而言,这并不是坏事。但对于谷歌最近这种迅速推进的表现,应该保持一定的保留态度。eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者 胡含嫣eNR速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中国考古,在许多外国人甚至中国人看来,一度非常神秘。近日记者在与中国考古学家的交流中了解到,从考古技术发展、到公众考古创新,再到中外考古交流,中国正不断构建具有中国特色、中国风格、中国气派的考古 中国发展网讯 据中国野生动物保护协会微信公众号消息,为持续推进大熊猫保护事业,中国野生动物保护协会已分别与西班牙马德里动物园和美国圣迭戈动物园就新一轮大熊猫国际保护合作事宜达成一致并签署协 中国经济导报 中国发展网讯 2月20日,龙年春节热闹欢乐的氛围还未散去,甘肃成县就以开局就是决战的干劲、起步就是冲刺的拼劲的崭新面貌召开2024年工作务虚会,聚焦县域经济高质量发展,围绕“2023年怎么看,2   中新经纬2月23日电 (周奕航)“和以往相比,今年的订单量足足翻了四五倍。”山东省菏泽市曹县的汉服加工厂老板陆平(化名)对中新经纬表示。  这个春节,马面裙火了。许多年轻人身穿马面裙,行走在大街小巷、灯展庙会间   娃哈哈董事长宗庆后转入ICU救治 公司昨晚声明:目前情况稳定每经记者 黄鑫磊 叶晓丹  2月22日,杭州阴雨,气温骤降。  当日下午,有消息称杭州娃哈哈集团有限公司(以下简称娃哈哈)董事长宗庆后近日因身体不适入院治 。

本文链接:谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了http://www.sushuapos.com/show-5-3916-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 加拿大对国际留学生提高生活费存款要求

下一篇: 克里米亚东部一天然气管道起火 约3万居民生活受影响

热门资讯

推荐资讯

  • 总投资约2.1亿元, 扬州仪征一轻奢民宿项目开工

    近日,枣林湾旅游度假区举行了“八村联兴”共富项目发布会暨枣林湖畔文化旅游发展公司少间轻奢民宿开工仪式。据了解,此次开工的少间轻奢民宿项目,包括亲子乐高主题IP的找你萌,摇

  • 青岛极地海洋公园二期新场馆正式开业

      4月28日,青岛极地海洋公园焕新升级的两大场馆惊艳亮相,“深海奇幻—水母秘境”和“海平线剧场”正式开业。其中,“深海奇幻—水母秘境”,通过提升多重体验方式、高科技融入

  • 小红书正进行新一轮估值200亿美元融资

      4月29日,据IPO早知道公众号消息,小红书正在进行新一轮估值200亿美元的融资。接近本轮融资的投资人透露,本轮融资实则就是小红书的Pre-IPO轮融资,将为小红书潜在的IPO作一定

  • 携程推出首个“上海入境免费半日游”项目

      自4月15日起,携程推出首个“上海入境免费半日游”项目,通过向中转上海的国际旅客提供免费半日游产品,不仅提供免费交通接送及外文向导讲解,还提供外币兑换及免费上网服务等

  • 一场破天荒的对话中,中西文化热烈碰撞

    为了京昆新歌剧《凯撒》的上海演出,当代传奇剧场艺术总监、著名演员吴兴国提前一周抵沪,与“昆曲王子”张军一起排练。今年2月,这部用京剧和昆曲演绎

  • TCL科技:2023年归母净利润同比上涨747.6%至22.15亿元

    4月30日,TCL科技发布了2023年业绩报告。报告显示,该公司2023年营业收入为1743.67亿元,同比增长4.69%。同时,归属于母公司的净利润为22.15亿元,同比增长747.6%,而上一年度该数字为2

  • 县域旅游:既有慢生活,也有性价比

    从携程等线上旅游平台发布的预定数据来看,今年“五一”期间的热门旅游县域中,既包括甘肃敦煌等历来较火的旅游目的地,也有江浙沪、京津冀等周边城市的

  • 如此朴素,如此节制

    《孔秀》是导演王超的第九部电影,也是王超第一次改编他人的作品。这部影片改编自作家张秀珍的半自传小说《梦》,讲述了20世纪60年代到80年代,一位名叫

  • 小猪民宿:五一民宿订单量同比增长102%

    五一小长假圆满落下帷幕,今年假期全国各地人潮涌动,再度上演“人从众”盛况。小猪民宿平台数据显示,今年五一小长假民宿订单量同比去年增长102%,平均入住时长3.2天,重庆、成都、

  • 桂林:全面实施景区焕新工程

      近日,桂林市召开A级旅游景区服务质量警示教育工作会议,提出聚焦问题难点,全面实施景区焕新工程,推动全市A级旅游景区高质量发展。  会议提出,要认真梳理去年对全市A级旅游

  • 上海海峡国际旅行社有限公司100%股权转让,底价249.04万元

      5月8日,据全国产权行业信息化综合服务平台披露,上海海峡国际旅行社有限公司100%股权挂牌转让,转让方为上海天虹兴港实业发展有限公司,转让底价为249.04万元,信息披露起止时间

  • 义乌产业园区最大保租房项目拟于明年3月投运,可提供3838套房源

      5月7日消息,作为义乌产业园区配套集中建设体量最大的保障性租赁住房项目,义乌信息光电高新区人才社区正在加快建设中,主体工程处于收尾阶段,室内装修工程即将开始,计划于2025

  • 日榜
  • 周榜
  • 月榜