设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗

发布时间: 2024-06-16 17:43:47 来源:

21世纪经济报道记者冯恋阁 实习生孔雅萱 广州报道iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

#斯坦福抄袭中国大模型#的话题近日出现在各大平台热搜中,引发了全网关注。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2名斯坦福学生和1名南加州大学学生组成的AI团队发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称训练出了一个开源多模态模型Llama 3-V。这一模型比GPT-4、Gemini Ultra、Claude Opus等模型能力更强,更引人注目的是,其训练成本只需要500美元。很快,Llama 3-V 冲上了全球知名开源社区HuggingFace的趋势榜首页。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不久,有网友发现,Llama 3-V与清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5在模型结构、代码、配置文件等方面几乎一模一样,只是将变量名称做了更改。该网友更是直接将相关的关键证据一一截图,进行列举证明。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随后,面壁智能团队证实,Llama3-V与MiniCPM一样,可以识别出“清华简”上的战国古文字(清华大学于2008年7月收藏的一批战国竹简),“不仅对得一模一样、连错得都一模一样”。 这一古文字数据是研究团队花费数月从竹简上逐字扫描、人工标注得到的,并未对外公开。Llama 3-V模型的团队成员 Aksh Garg在其社交平台上发文回应了质疑,表示所有训练代码由团队另一位成员编写,自己并不知情,并对原作者表达歉意。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

至此,此次大模型套壳抄袭事件暂告一段落。不过,公众对于大模型套壳的讨论并未止歇。斯坦福团队错在何处?大模型“套壳”争议频出,究竟是开源常态还是原创性缺失? iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

开源,开的是什么?

早在生成式AI影响力大爆炸前,开源和闭源就是软件开发过程中必须要经历的决策。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“源”最初指的就是源代码。公开与否,决定了后来者在使用、改编这个软件时有多大的自由度。闭源意味着只有编写者或者系统开发商掌握着修改源代码的权力,这虽然为经营者带来了先发优势,但一定程度上也抑制了后来者的创造能力,进而导致后期影响力扩大变得相对困难。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,随着技术进步,开源逐渐成为互联网精神的一部分。比如,操作系统Linux,在上世纪90年代初发布时就坚持开源至今。Linux开源极大推动了互联网发展。此前,360公司创始人周鸿祎评论“没有开源就没有 Linux,没有 Linux 就没有互联网。” iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从字面意思来看,开源似乎意味着开源模型成为一种公共资源,可以被随意使用、修改。但事实上,开源生态不是“法外之地”,其使用行为将受到开源许可的约束和管理。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研发者作为版权所有人,可以通过开源许可授予不特定的使用者附条件的版权许可。使用者需要按约定,通过特定使用方式、在约定包含的场景中使用开源模型。“大模型开源的程度、方式不尽相同,开源协议自然也不一样。”阿里研究院AI治理中心主任傅宏宇指出。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当前通行的开源协议包括GPL、BSD、MIT、Mozilla、Apache和LGPL等,它们在修改后是否可闭源、修改后是否需要说明等方面要求各不相同。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

面壁智能联合创始人、首席科学家刘知远在朋友圈发表了一篇言辞恳切的回应,认为Llama3-V团队未能遵守开源协议对前人成果尊重,严重破坏了开源共享的基石。“Llama3-V团队的问题不仅仅在于违反了哪项开源协议,而是将他人成果声称为自己的成果。”刘知远在接受21世纪经济报道记者采访时进一步指出。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本次事件主角MiniCPM采用的开源协议Apache Licence 2.0。这一协议允许使用者修改代码,也允许使用者将成果开源或商用。对应的交换条件则是,后续使用者需要在被修改的文件中说明修改过代码;在修改后以及源代码衍生的代码中需要包含源代码的协议、商标、专利声明等说明。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如何分清“壳”与“核”?

违背开源协议的“套壳”行为是如何被发现的? iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然针对特殊数据集的识别能力并不是惯用的防伪手段,但这次风波中“套壳”嫌疑最终被确认,直接证据是能够识别“清华简”上的战国古文字。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据刘知远介绍,除了类似“清华简”识别能力这样的“水印”外,“套壳”一般通过大模型的分词词表、架构设置(如层数、向量维数等)和能力表现等判断。“这次之所以能够比较确认Llama3-V套壳MiniCPM-Llama3-V 2.5,主要还是这层‘壳’薄到近乎透明,能够找到多方面的直接证据。”刘知远表示。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在傅宏宇看来,窃取模型参数、谎报模型来源等不负责任的使用行为,违背了诚信原则和开源精神,开源社区可采取措施予以处理和规范。如果对开源模型的“抄袭”构成知识产权侵权行为,开源模型权利人则可以依据开源许可协议保护自身权益。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他认为,此次Llama 3-V对MiniCPM的套壳,符合知识产权侵权行为的定义。“虽然项目已经开源,但研发者依然是工作成果的版权权利人,有权对其作品主张权益保护。”傅宏宇指出,斯坦福团队这种将他人开源的工作成果微调并直接转化为自己的工作成果公开发布的行为,可参考《计算机软件保护条例》的相关规定构成传统软件知识产权侵权,具体涉及复制著作权人软件、向公众发行、通过网络传播软件、故意删除或者改变软件权利管理电子信息等侵权行为。iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

围绕大模型套壳的是非之争并不是首次上演。在此之前,多家国内外企业都曾卷入类似纷争。比如,李开复零一万物发布的大模型“Yi”就曾被指控使用了Llama的架构,只对两个张量进行了重命名。iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,这些争议到最后似乎都没有迎来一个确定的结果。在几个回合的指控与回应后,没有判决、赔款或者标准来回应各界的关注。iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

站在巨人的肩膀上 

“套壳”争议屡屡出现,可能是由于各界对这一概念存在不同的理解和判断。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

刘知远告诉21世纪经济报道记者,“套壳”的说法,很多时候宽泛地包括了所有已有开源模型利用自有数据进一步训练和微调,从而形成定制模型的行为。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但与大众对“套壳”的负面看法有些许不同的是,对开源模型的微调动作,实际上是被允许和鼓励的。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“套壳”这种说法本身就带有贬义的意味。刘知远坦陈:“很多开源模型的协议允许定制和修改,只要遵守开源协议就应当支持和保护。” iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“善用前人成果,努力站在巨人肩膀上实现高质量发展,是开源社区的重要价值。”他指出。iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI技术日新月异,市场需求也瞬息万变。金沙江创投主管合伙人朱啸虎曾经公开表态,AI应用应该尽可能实现快速商业化,而Llama的发布增大了创业者在逐渐收紧的时间窗口活下来的几率。iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了时间,算力、算法、数据无一不是自研大模型需要面对的难关。这种情况下,以开源模型为基础微调的定制模型成为性价比最高的选择。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此前,现象级AI搜索产品Perplexity所在公司的CEO Aravind Srinivas在一档播客上直白地表示,“一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义”。iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就如通往成功的路站在巨人的肩膀上更好走,“质疑套壳、理解套壳、成为套壳”或许是AI应用元年的一种求生思路。 iZr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

患者只需吸入特制的“氙气”,3.5秒后一幅人体肺部磁共振3D影像就呈现出来。影像中,气体可抵达肺部的位置清晰可见,患者的肺部微结构、气体交换功能情况等一目了然。日前,中国科学院精密测量科学 日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温、高压、黑暗等极限环境。能否从这些极限环 根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地图涵盖了大约130万个活跃类星体的精确空间 3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023年1月23日在北京西城区拍摄的金星(左上)、土星 “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源管理司副司长张鸿星21日接受科技日报记者采 3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光储高压先进技术发布会现场。阳光电源股份有 。

本文链接:斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗http://www.sushuapos.com/show-2-6922-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 对话丨面壁智能刘知远谈被斯坦福学生AI团队抄袭:善用开源成果,将快速提升AI能力的“下限”

下一篇: 马斯克赢下天价薪酬关键一战 560亿美元可以买下中芯国际

热门资讯

  • 我国成功研制可靶向送药的磁驱软体机器人

    中国科学院深圳先进技术研究院15日发布消息称,该院科研团队研发了一种具有靶向送药功能的磁驱软体机器人,该机器人能够根据器官内部环境的特点选择合

  • 我国科研团队揭示非洲猪瘟病毒感染致病机制

    记者3月18日从兰州大学获悉,该校动物医学与生物安全学院郑海学教授团队解析了非洲猪瘟病毒(ASFV)在猪体内感染的靶细胞,以及在靶细胞内延长感染的机制

  • 自主研制!哈工大“天都二号”探月卫星成功发射

    科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘

  • 最小资源消耗的量子态分辨实现

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展:他们在最小资源消耗的量子态分辨问题中首次提出了全局最优

  • 我国首个制氢加氢一体站团体标准发布

    我国制氢加氢一体站建设有了团体标准。记者从中国石化获悉,为推动我国氢能交通产业发展,中国石化联合国内数十家氢能头部企业发布了国内首个《制氢加

  • 英伟达AI风暴席卷医疗行业 “AI制药”是风口还是泡沫?

      英伟达AI风暴席卷医疗行业 “AI制药”是风口还是泡沫?  季媛媛  全球医疗健康行业正刮起最强AI风暴。  当地时间3月18日,全球瞩目的顶级AI盛会――英伟达2024年GPU

  • 黑场显微镜让单个颗粒实现无标记光学显微成像

    3月21日记者从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • AI伴侣能否带来亲密关系

    自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应

  • huaweiMate 70细节曝光!芯片性能比肩5.5nm、新鸿蒙5.0系统

    3月24日消息,今天数码博主“厂长是关同学”曝光了huaweiMate 70系列电话的部分配置信息。该博主表示,huawei全新的Mate 70系列首发会搭载新的芯片,芯片的

  • 英国2026年试飞电动“飞的”

    据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出

  • 吸烟会增加腹部脂肪

    科学杂志《成瘾》3月21日发表的一项新研究显示,刚开始吸烟和终生吸烟都可能增加腹部脂肪,特别是内脏脂肪。内脏脂肪与心脏病、糖尿病、中风和痴呆症

推荐资讯

  • 日榜
  • 周榜
  • 月榜