设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

网络抓取数据用于生成式AI训练?英国ICO:合法利益是可行关键

发布时间: 来源:

21世纪经济报道 记者郑雪 北京报道eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

海量数据、算力和算法,使得生成式人工智能侃侃而谈、无所不知。数据来源方面,不少企业的数据源于公开网络抓取,也因此产生了相关纠纷,如OpenAI因数据抓取引发多起纠纷。纠纷背后,涉及网络抓取合法性问题,即通过网络抓取数据训练而成的生成式人工智能模型,是否具有法律依据?eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

今年1月,英国ICO(theUK Information Commissioner's Office,英国信息专员办公室)宣布启动生成式人工智能系列研究,探讨数据保护法如何适用于生成式人工智能模型的开发和使用。通过网络抓取数据训练而成的生成式人工智能模型是否存在法律依据?首次研究便回应了这一问题。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于人工智能企业而言,何以训练数据如此重要?eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据,尤其是高质量的数据,成为人工智能发展关键。生成式人工智能模型开发的第一步,便是收集和预处理训练数据,通过数据训练模型,结合微调,以便在特定环境中部署。如GPT-3的数据量为45TB。同时,数据又是稀缺的,根据Epoch的研究预测,数据耗尽最早可能出现于 2026 年。此外,AIGC厂商数据来源大致分为三个面向,公开渠道爬取的数据便是其中之一。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

生成式人工智能的训练数据来自何处?eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ICO指出,大多数生成式人工智能开发人员都通过可公开访问的来源获取数据,或直接从网络抓取,或间接从拥有数据的第三方获取,或两者结合。从互联网中抓取的信息包括个人数据,还包括泄露的信息等。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于网络抓取数据训练而成的生成式人工智能的合法基础如何判定?eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ICO指出,公开抓取数据训练而成的生成人工智能模型,合法利益可以成为其法律依据,但前提是模型开发者通过三部分测试(three-part test):eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一是,目的测试,即是否存在有效利益。开发者的利益涉及商业利益以及更广泛的社会利益,需要对模型的使用进行适当控制。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

二是,必要性测试,即鉴于目的,网络抓取是否必要。ICO理解,目前大多数生成式人工智能,只能使用通过大规模抓取获得的数据量进行训练。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

三是,平衡测试,即评估对个人的影响,并确定是否侵犯了个人的利益、权利和自由(此处重点关注对个人的潜在影响)。通过网络抓取收集数据是一种“隐形处理”活动,在此情况下,公众可能会失去对个人数据处理的控制权,或者无法行使法律所授予的相关权利。ICO指出,隐形处理和人工智能相关处理都被视为高风险活动,需要在其指导下进行DPIA(数据保护影响评估)。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

可以看到,生成式人工智能模型正逐渐引发风险和危害,可能是因为收集的训练数据,也可能和模型使用相关。相关风险又该如何缓解?eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

ICO列明三种情况:eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

初始开发人员部署的生成式AI模型:部署在自己的平台时,期望能够完全控制模型的生成和使用eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由第三方通过API部署的生成式AI模型:在此情况下,初始开发者可以部署特定技术(例如输出过滤器等)或通过组织予以解决。如对API接口的限制查询、对模型使用进行监控、通过合同予以限制等。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

提供给第三方的生成式人工智能模型:这种情况下,初始开发者会将底层模型副本或大量细节(如模型权重、起始代码等)提供第三方,客户选择运行自己研发的生成人工智能模型。ICO指出,合同控制措施可以减轻这种风险,但仍需实践证明上述措施可行eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

值得注意的是,此次是ICO关于生成式人工智能开发和使用的新想法,不应将其解释为数据处理需要符合的法律规定。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据抓取从来都不是一个新问题,数据抓取及合法性边界是权益衡量的结果,同时需要具体分析(case by case),对于新兴的人工智能企业来说亦如此。eZt速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月19日,记者从香港科技大学获悉,该校以人工智能生成式工具设计出10位“AI讲师”, 这些“AI讲师”来自世界各地,属不同民族及文化背景。该校希望通过创新教学模式,激发学生学习热情,提升课堂参与度 21世纪经济报道记者孔海丽、实习生邓熙涵 北京报道“民以食为天,食与民同欢”,吃得健康、吃得安全是消费者长期以来的普遍共识。当代消费者已不止于填饱肚子,而是讲求“精耕细作”。消 联合国机构3月20日发布的《全球电子垃圾监测》报告显示,2022年全球范围内共产生6200万吨电子垃圾,其中仅有不到四分之一被回收利用。报告显示,2022年全球电子垃圾的产生量相比2010年增长了82%。 3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光储高压先进技术发布会现场。阳光电源股份有 美国和法国的科学家联合团队借助新的3D打印技术,开发出一种多层人造皮肤,只需18天即可长成。这种仿真皮肤可用于提升护肤品测试效率,并催生更好的皮肤治疗方法。相关研究发表于新一期《先进功能 随着无人驾驶技术的快速发展,无人车在城市配送、环卫清扫、安防巡逻等应用场景中已得到较好示范应用。3月22日,南京溧水经济开发区管委会与南京易咖智车科技有限公司联合举办“金陵智地 易启未 。

本文链接:网络抓取数据用于生成式AI训练?英国ICO:合法利益是可行关键http://www.sushuapos.com/show-2-2370-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 首届“群体协同与自主”创新发展论坛在京举行

下一篇: 长三角两会|发展“新质生产力”要开放开窍,张燕生对浙江的六个观察

热门资讯

推荐资讯

  • “封关百日,有大企业主动谈合作”

      中新经纬3月27日电 (薛宇飞)“封关100天,我们有三批货物享受了加工增值内销免关税政策,节税8%。”27日,正大(海南)兴隆咖啡产业开发有限公司(下称正大兴隆)总经理叶剑对中

  • 中关村论坛观察:“元宇宙没退烧”,也不只是戴VR眼镜

      中新经纬3月27日电 (谢婧雯 周奕航)“元宇宙并未‘退烧’,而是其概念被不断迭代的新技术名称所掩盖。”2026中关村论坛年会期间,加拿大工程院院士、欧洲科学院外籍院士郭

  • 恒为科技并购“转弯”:现金+增资,股权降至51%

      中新经纬3月27日电 (张澍楠)从拟拿下75%股份到不少于51%股权,从“发行股份+现金+募资”改“现金+增资”,恒为科技历时近半年的并购“大转弯”。  现金+增资  时间拉回

  • 外媒:西方天然气公司成中东局势受益者

      中新经纬3月26日电 据路透社报道,美伊局势让西方天然气供应商及贸易商股价成为市场受益者。投资者预计,供应路线可绕开中东地区的企业,将从高能源价格中获得巨额收益。  

  • A股三大指数集体低开 存储芯片板块领跌

      中新经纬3月26日电 周四,A股三大指数集体低开。上证指数跌0.17%,报3924.96点;深证成指跌0.32%,报13756.87点;创业板指跌0.54%,报3299.03点。  来源:同花顺  盘面上,行业板块

  • 英唐智控澄清:正推进收购光隆集成、奥简微电子股权

      中新经纬3月26日电 25日晚,深圳市英唐智能控制股份有限公司(简称“英唐智控”)发布《关于市场不实传闻的澄清公告》。  公告显示,2026年3月25日,公司关注到东方财富网股

  • 东阿阿胶副总裁李庆川辞职

      中新经纬3月26日电 东阿阿胶股份有限公司(下称“东阿阿胶”)近日发布公告称,董事会收到李庆川提交的书面辞职报告,由于工作变动原因,李庆川申请辞去公司副总裁职务。辞职后

  • 外媒:欧洲天然气库存快空了

      中新经纬3月25日电 据彭博社报道,欧洲即将进入天然气储备季,但储罐已快耗尽,这意味着它将需要与亚洲买家竞争以确保供应。  报道称,根据欧洲天然气基础设施公司的数据,目前

  • 工信部:前2月电信业务收入同比降1.7%

      中新经纬3月25日电 工信部网站25日披露2026年前2个月通信业经济运行情况。其中提到,前2个月,电信业务收入累计完成2904亿元,同比下降1.7%。  工信部称,前2个月,通信业运行

  • 洲际油气高息借钱,还压上核心资产

      中新经纬3月25日电 (张澍楠)贷款利率10.5%、核心资产担保、被抵押主体资产高于合并报表总资产,这些字眼出现在洲际油气下属子公司贷款公告中。  上交所网站截图  该

  • 中国中车等5户央企人事变动

      中新经纬3月24日电 “国资小新”微信号24日发布5户中央企业5名领导人员职务任免消息。  中国中车集团有限公司  王锋任中国中车集团有限公司党委副书记、董事,提名为

  • A股早盘超4500股飘红 电力板块掀涨停潮

      中新经纬3月24日电 周二早盘,A股三大指数集体高开,此后探底回升。截至午间收盘,上证指数涨0.95%,报3849.34点;深证成指涨0.26%,报13380.05点;创业板指跌0.79%,报3209.76点。  

  • 日榜
  • 周榜
  • 月榜