设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

面壁智能CEO发文回应斯坦福某AI团队“抄袭”:感到遗憾

2024-06-04 08:56:30 来源:

  面壁智能CEO发文回应斯坦福某AI团队“抄袭”:感到遗憾cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  吕倩cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  近日,斯坦福大学AI团队疑似抄袭中国大模型创业公司的消息引发业内高度关注。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  6月3日,面壁智能CEO李大海与联合创始人刘知远先后发文,回应开源模型被斯坦福大学AI团队抄袭一事。李大海表示:“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  5月29日,一个来自斯坦福的AI团队开始在网络上宣传500美元就能训练出一个SOTA 多模态模型,该模型名为Llama3-V,作者声称Llama3-V比GPT-4V、Gemini Ultra、Claude Opus 性能更强。公开资料显示,团队两位成员是来自斯坦福大学的本科生,曾发表多篇机器学习领域论文,实习经历包括了AWS、SpaceX等。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  由于该团队成员拥有斯坦福、特斯拉等亮眼背景,Llama3-V项目很快冲到HuggingFace (一个开发者社区和平台)首页,并引发开发者群体的关注。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  一位用户在社交平台X 与 HuggingFace 上质疑 llama-3V 是否套壳MiniCPM-Llama3-V 2.5 ,后者为面壁智能推出的开源端侧多模态模型,于 2024 年 5 月 21 日发布。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  Llama-3V 团队彼时回应,他们只是使用了 MiniCPM-Llama3-V 2.5 的tokenizer(分词器,自然语言处理中的一个重要组成部分),并在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。但团队并未解释如何做到在MiniCPM-Llama3-V 2.5发布之前就获取详细tokenizer的具体方式。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  但随后,关于上述AI团队抄袭的声音越来越多。比如,Llama3-V的模型结构和配置文件与MiniCPM-Llama3-V 2.5完全相同,只是进行了一些重新格式化并将部分变量重新命名,如图像切片、分词器、重采样器、数据加载等变量。Llama3-V也具有与MiniCPM-Llama3V 2.5相同的分词器,包括MiniCPM-Llama3-V 2.5新定义的特殊符号。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  据HuggingFace 页面显示,最初Llama3-V的作者在上传代码时直接导入了 MiniCPM-V 的代码,然后将名称更改为 Llama3-V。但作为其中一个作者,Mustafa Aljadery(穆斯塔法・阿尔贾德里)并不认为该行为属于抄袭。他发文称,llama3-v推理存在bug,并不是抄袭。“我已经指出了架构是相似的,但MiniCPM的架构来自Idéfics,我们遵循Idéfics论文中的那些内容。架构是基于综合研究的,你怎么能说它是MiniCPM呢?MiniCPM代码的视觉部分看起来也是从Idéfics那里使用的。”cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  在李大海看来,另一证据在于Llama3-V同样使用了面壁智能团队新设置的清华简识别能力(清华大学于2008年7月收藏的一批战国竹简),且呈现的做错案例都与MiniCPM一模一样,而这一训练数据尚未完全公开。李大海称,这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加微妙的是,两个模型在高斯扰动验证(一种用于验证模型相似性的方法)后,在正确和错误表现方面都高度相似。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  目前,上述斯坦福AI团队已对HuggingFace 上的Llama3-V模型进行隐藏处理,作者解释该动作时表示:“我是为了修复模型的推理问题而将其隐藏,因为模型必须有特定的配置运行。”cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  “非常抱歉,我删除了它们,因为推理代码还没有准备好,每个人都有运行错误。我觉得人们现在最好不要用。你必须有特殊的配置。我一修好就把它放回去。”上述团队回应。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  记者向作者团队之一的Siddharth Sharma发送邮件,询问删库动作的具体原因,以及后续在满足什么条件后会进行大模型的恢复。截至发稿前,暂未得到回应。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  刘知远对此事评论称,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。面壁开源的 MiniCPM-Llama3-V 2.5 就用了最新的Llama3 作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库,该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  刘知远表示,国内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华OpenBMB正在通过持续的开源共享,在国际上受到了广泛的关注和认可,“这次事件也算侧面反映出,我们的创新成果也一直受到国际关注。”刘知远说。cMe速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:面壁智能CEO发文回应斯坦福某AI团队“抄袭”:感到遗憾http://www.sushuapos.com/show-5-17276-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 端午假期将至 南铁预计发送旅客514万人次

下一篇: 迎接暑运 重庆江北国际机场将新开加密数条国际航线

热门资讯

推荐资讯

  • 2023年出境游相关新增企业同比增长近300%

      近日,据企查查数据显示,国内现存出境游相关企业12.18万家。近十年其注册量呈整体增长态势。2019年注册量达3.34万家,同比增长15.98%,达近十年注册量峰值。此后,受疫情等因素

  • 千味央厨:2023年实现营收19.01亿元,同比增长27.69%

    4月28日,千味央厨披露2023年年度报告。2023年,公司实现营业收入19.01亿元,同比增长27.69%;归母净利润为1.34亿元,同比增长31.43%。其中2023年因股权激励产生的费用为1791.08万元,

  • 我爱我家2024年一季度实现营收27.5亿元

      近日,我爱我家发布2024年一季度财报。财报显示,2024年一季度我爱我家实现主营业务收入27.5亿元,同比下降12.6%,实现归属于母公司所有者的净利润约0.25亿元。业绩报告显示,202

  • 北京市文明旅游主题宣传活动启动

    4月29日,“文明旅游 美丽中国”全国首发站——北京在行动文明旅游主题宣传活动举办,现场同步启动了“遇见你,成为最美的风景”北京市文明

  • 我们一起上春山

    人间美景四月天,草色青漫水如蓝。春日登山成了很多人迎接春天又锻炼体魄的最佳选择之一。有的人边走边吃,悠闲赏春花;有的人手脚并用,勇攀高峰成就满怀

  • 王府井集团2024年一季度实现营收33.08亿元

      近日,王府井集团发布2024年第一季度财报。报告显示,王府井集团2024年一季度实现营业收入约33.08亿元,同比下降1.74%;归属于上市公司股东的净利润约2.02亿元,同比下降10.86%

  • 浙江莫干山开元名庭和瑰宝酒店齐开业

    4月28日,浙江德清莫干山地信开元名庭大酒店、德清莫干山Ruby Lacey瑰宝酒店正式开业,地理信息小镇会展商圈再添重磅新成员。两家酒店均坐落于德清莫干山地理信息小镇,是由湖州

  • 香港迪士尼乐园:本季将招聘500人,起薪点连津贴在18000港元以上

      据香港电台网站报道,香港迪士尼将于5月8日及9日举行招聘会,提供500个全职职位,主要涵盖乐园服务岗位,也包括娱乐事务技术、乐园营运、零售及餐饮职位。现场设有前线营运团队

  • 美团:五一前三天上海本地生活服务消费位居全国城市第一

      近日,美团发布的五一假期“吃喝玩乐”消费数据显示,五一假期前三天,全国本地生活服务消费同比增长25%,全国餐饮堂食订单量较去年同期增长73%。其中,上海本地生活服务消费位居

  • 《春色寄情人》导演程亮:爱情不是爱情剧的唯一密码

    “生命晨起暮落,爱意不期而遇。”一个是性格桀骜但身心孤独的遗体整容师,一个是身体虽有缺陷但勇敢耀眼的金牌销售。他们原本在各自的世界里前行:一个

  • 吉林桦甸第二座五星酒店即将建成投用,总投资1.8亿元

    据江城日报消息,日前,地处吉林省桦甸市桦甸大街繁华路段的华宇国际酒店项目已完成主体封闭,全面进入内部装修阶段,预计7月1日正式对外开放营业。这标志着桦甸市继白云国际酒店后

  • 时间与桑皮纸 亦敌亦友

    夜已深,窗外未静。寄居近处,灯火通明,南北向的一条马路,车流不息属常态。喇叭声时起,烧烤味不时飘来,兼有婴儿啼哭声、家长督学的呵斥声。所谓写作,只能见

  • 日榜
  • 周榜
  • 月榜