设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

构建多元化的人工智能训练数据供给体系

发布时间: 2025-01-19 08:31:03 来源:

【析理论道】8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据作为数字时代的“新石油”,不仅是传统产业、新兴产业发展的重要支撑,同时也是人工智能科技创新的关键创新资源。8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

现阶段,人工智能产业发展面临的最突出、最迫切的困境,便是训练数据供给不足。随着网络空间已公开数据资源趋于“消耗殆尽”,人工智能产业愈发需要专业化程度高、领域属性强的高质量数据来提升算法模型性能。因此,建构我国人工智能法治保障体系的一项核心目标,便是形成多元化的训练数据供给体系,以满足不同规模企业的训练数据使用需求,推动算法模型性能朝着专业化方向升级。而构建多元化的人工智能训练数据供给体系是一项系统性工程,只有通过持续拓宽数据采集渠道、扩大数据流动范围、提高数据质量要求,才能为人工智能产业注入源源不断的创新动力,实现高质量发展。8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

健全多源头数据采集机制,拓展数据广度。在实践中,人工智能企业获取训练数据的方式主要包括网络爬虫抓取已公开数据、使用开源数据集、购买数据产品等。整体而言,数据采集方式较为单一,难以满足相关产业对训练数据质量的基本需求。若想扩展训练数据获取广度,需要在以下两个层面实现数据采集机制的延伸:一是在数据采集行为合法性方面,以类型化列举、监管实践指南等方式明确训练数据来源合法性的常见类型,以消除企业业务合规担忧;二是在数据市场供给形式方面,深入探索公共数据的开放利用模式,降低中小企业获取高质量训练数据的市场门槛,整合数据交易基础制度,拓展可交易数据产品的质量和类型。具体而言,公共服务部门在长期社会公共服务过程中积累了海量高质量数据,但由于数据安全和数据使用收益归属不明等现实因素,此类公共数据面向人工智能产业的开放使用制度还需进一步深入探索。以交通部门为例,实时路况数据不仅可以提供实时交通拥堵情况报告,在人工智能技术加持下,还可以预测性地分析未来时间段交通流量情况、交通事故发生概率等。科研机构也积累了大量专业性较强的科学数据,如医学研究机构的临床病例数据,经由科学化整理和标准化处理,能够在医疗影像诊断、传染病防控等领域发挥重要作用。这些潜在的数据“富矿”,仍有待配套的法律制度予以松绑和深挖,进而形成层次化的数据采集渠道。8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

建构高质量数据标注机制,挖掘数据深度。对于训练数据,既有数量上的要求,更有质量上的要求。训练数据的精确性、一致性、时效性等技术指标,直接影响着人工智能性能能否提升。以医疗影像识别为例,若是存在训练数据将正常细胞标识为癌变细胞、同一细胞多次标注为不同信息内容等情况,那么这些质量堪忧的训练数据只会“污染”人工智能性能,进而严重危害患者生命健康。国家网信办等七部门2023年发布的《生成式人工智能服务管理暂行办法》也专门要求在人工智能技术研发过程中,服务提供者应当制定符合本法要求的“清晰、具体、可操作的标注规则”。因此,合理科学的数据标注规则是保障训练数据质量和避免算法歧视的重要环节。在数据标注方式上,应当以“人机协作标注”为主要方式。技术研发者和服务提供者虽然可以通过批量自动化处理系统对各类数据资源进行高效批注,但潜在误差标注风险难以有效控制。相对地,采用人工批注模式,除了成本高昂之外,还可能在不经意间渗透标注人员的个人伦理观,产生潜在科技伦理风险。因此,理想的数据标注方式应是人机协作,以此填补上述数据标注方式的短板,提升数据标注结果的准确性、完整性和中立性。8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

完善数据跨境传输机制,丰富数据类型。人工智能训练数据的高质量供给,离不开数据跨境传输制度的支撑。不同国家、不同地区的数据资源具有多元化的本地特征,这类数据资源能够优化人工智能算法模型,提升人工智能产品和服务的通用性。近年来,我国数据跨境传输的法律法规相继出台,确立了以“安全评估、个人信息出境标准合同、个人信息保护认证以及特殊机制”为内容的数据跨境传输治理框架。同时,《促进和规范数据跨境流动规定》进一步解绑了基于学术合作、跨国生产制造、市场营销等活动进行数据跨境传输的限制条件。为了更好推动训练数据的跨境流动,需要遵循发展与安全并重的治理逻辑。从长远来看,数据资源本地化不利于人工智能产业的创新发展,也不利于数据要素的市场化配置。数据跨境传输制度的建构是为了实现又好又快的跨境传输数据,在数据资源的“一进一出”中,充分获取全球范围内的高质量训练数据资源。在促进产业发展的同时,还需要确保数据出境安全,积极探索多边、双边数据跨境合作机制,提升我国在数据跨境传输国际规则制定中的话语权,以构建网络空间命运共同体为导向,实现训练数据安全有序流动。8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

出台数据供给配套政策,畅通数据流动。在财政支持政策方面,不同规模的科技企业获取训练数据的能力并不相同,为了降低人工智能产业的市场门槛,有必要通过设立专项资金、实施税收优惠政策等手段降低中小企业获取高质量训练数据的实际难度。针对在特定领域具有卓越表现的中小企业、科研机构予以专项扶持,特别是涉及先进标注算法、数据整合技术等事项,可以通过专项资金助力企业购置更先进的设备、扩充专业人才队伍。在技术标准体系方面,统一的技术标准是确保训练数据质量、规范数据供给的重要工具。在训练数据采集、标注环节,设置统一的技术标准体系能够有效降低后续数据分析、数据挖掘等环节的研发成本。同时,科学客观的技术标准也能针对科技伦理事项辅助确立更为统一的标注规则。在基础设施平台建设方面,为了缓解各行业、各领域数据流动范围狭窄、流动类型有限等“数据孤岛”现象,需要政府部门推动建设面向训练数据供给的数字基础设施以及公共算法训练平台。通过这些基础设施和公共平台,将涵盖经济、地理、交通等各个领域的数据资源进行汇总,从而有效提高训练数据的总体数量和质量。8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(作者:赵精武,系北京航空航天大学法学院副教授、北京科技创新中心研究基地副主任)8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

《光明日报》( 2025年01月17日 11版)8IZ速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  西安碑林博物馆14日起局部开放 门票不分淡旺季每人次10元  中新网西安1月12日电(记者 阿琳娜)记者11日从西安碑林博物馆获悉,该馆自1月10日起采用低票价运行模式,并于1月14日起仅对外开放孔庙古建筑群区域。     刚被罚款3.55亿美元后 特朗普“带货”球鞋  中新网2月19日电 据美联社消息,当地时间17日,美国前总统特朗普在一场商业活动中带货了一双“特朗普”牌的金色球鞋,引发热议。  据报道,特朗普当天在费城会议中心举行   人社部:整治虚假职业技能培训  人社部近日发布通知,要求规范培训机构办学,严禁以招生费等名义直接或变相买卖符合补贴条件的生源,以联合办学、培训合作等名义违规转包政府补贴的培训项目,与参训人员串通提供虚假信息   OpenAI首个视频生成模型发布   可用文本生成视频 虚拟与现实已分不清?Sora将带来什么  在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包   长三角观察|揽人、赶工、抢订单:春节拼经济“热辣滚烫”  2月10日是正月初一,上午10点,满载工业品、电子产品和衣帽服饰的新春首列“义新欧”中欧班列从浙江义乌铁路口岸出发,驶往西班牙马德里。  在江苏昆山的华   春节假期中国跨区域人员流动量预计超23亿人次  中新社北京2月17日电 (记者 刘文文)17日(正月初八)是中国龙年春节假期最后一天。来自2024年综合运输春运工作专班的最新数据显示,2月10日至17日(农历正月初一至初 。

本文链接:构建多元化的人工智能训练数据供给体系http://www.sushuapos.com/show-5-42333-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: “精准思维”的理论内涵与实践要求

下一篇: 全面把握新时代廉洁文化建设的总体要求

热门资讯

推荐资讯

  • 千味央厨:2023年实现营收19.01亿元,同比增长27.69%

    4月28日,千味央厨披露2023年年度报告。2023年,公司实现营业收入19.01亿元,同比增长27.69%;归母净利润为1.34亿元,同比增长31.43%。其中2023年因股权激励产生的费用为1791.08万元,

  • 国内首个“国际化友好景区”共建计划在黄山启动

      近日,国内首个“国际化友好景区”共建计划在黄山启动。据悉,该计划由中国人民银行黄山市分行、黄山风景区管委会等部门共同指导和支持,由支付宝、黄山旅游股份有限公司率先

  • 携程推出首个“上海入境免费半日游”项目

      自4月15日起,携程推出首个“上海入境免费半日游”项目,通过向中转上海的国际旅客提供免费半日游产品,不仅提供免费交通接送及外文向导讲解,还提供外币兑换及免费上网服务等

  • 我们一起上春山

    人间美景四月天,草色青漫水如蓝。春日登山成了很多人迎接春天又锻炼体魄的最佳选择之一。有的人边走边吃,悠闲赏春花;有的人手脚并用,勇攀高峰成就满怀

  • “京津冀协同发展10周年书法交流展”开幕

    4月28日,“翰墨弘道——京津冀协同发展10周年书法交流展”在北京一得阁美术馆开幕。现场共展出150余件作品,以京津冀区域书法家和书法爱

  • 三特索道2024年一季度实现营收1.42亿元

      4月29日,三特索道发布2024年第一季度财报。财报显示,三特索道2024年一季度实现营业收入1.42亿元,同比下降11.37%;归属于上市公司股东的净利润3379.17万元,同比增长17.67%。

  • 沃德酒店集团首家民宿酒店开业

    近日,沃德酒店集团旗下的首家民宿酒店——观云里店在青岛开业,标志着沃德酒店集团在多元化酒店业务布局上迈出了坚实一步。酒店位于胶州路116号,交通便利,紧邻中山路地铁站B口。

  • 当你唱起金翅鱼之歌

    《金翅鱼之歌》是一部在生态保护的底色下,讲述一个北漂秉持人与自然和谐发展的信念,而历经曲折与现实对抗的小说。作者用了“伪纪实”的方法来构思小

  • 《夜行者》触摸谍战舞台剧天花板边界

    从澳门回归25周年的命题创作到从澳门本土原型人物的书籍日记中找寻舞台形象,谍战舞台剧《夜行者》,让观众看到了话剧舞台题材延展的另一种可能性。李

  • Club Med地中海俱乐部:五一期间中国度假村平均入住率约9成

      从4月30日至5月4日五一假期度假村客房入住率来看,Club Med地中海俱乐部中国度假村平均入住率约9成。从地中海俱乐部国内预订数据显示,家庭客群仍然是五一假期出游的主力军

  • 古兜控股(08308)2023年收入5268.4万元,同比增加25.74%

    近日,古兜控股(08308)发布截至2023年12月31日止年度业绩,该集团期内取得收入5268.4万元(人民币,下同),同比增加25.74%。公告称,收入增加主要由于集团的温泉度假村及酒店营运业务

  • 横琴粤澳深度合作区出新政盘活存量资产,商办可调整为酒店

    日前,横琴粤澳深度合作区发布了关于印发《关于促进合作区酒店业高质量发展的若干措施》和《既有商业办公建筑调整为酒店临时使用的操作指引》的通知。其中提到:1、允许以8年为

  • 日榜
  • 周榜
  • 月榜