设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AI浪潮下的数据:自动驾驶需要何种标注?|GAI进化论

2024-05-29 17:24:13 来源:

南方财经全媒体记者江月 上海报道8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

自动驾驶是人工智能时代里最令人兴奋的科技之一。过去大约十年来,自动驾驶技术开始起步并得到一定程度发展,但目前仍然在等待里程碑式的突破,以期未来真正实现规模化应用。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Holger Caesar是荷兰代尔夫特理工大学智能车辆组助理教授,他的学术生涯几乎和这一代自动驾驶浪潮同步启程,因此,他将过去约10年的时光专注在了这个领域的技术研究。其间,他在自动驾驶明星公司Motional作为项目负责人主导开发了自动驾驶数据集nuScenes和nuPlan,自2019年以来,这两个数据集也位居全球范围内最为使用广泛的开源自动驾驶数据集前列。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

事实上,数据是算法、算力之外第三驾驱动人工智能发展的马车,不少行业人士都认为,好的数据集十分难得,甚至是算力和算法发挥价值的前提条件。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在人工智能新一轮浪潮来临时,Holger Caesar正致力于将自动驾驶数据集带向第三代。他告诉南方财经全媒体记者:“自动驾驶数据集的标注量可以缩小至目前水平的1/20至1/100,未来可能覆盖全球场景。”其中,基础模型的迅速发展带来了更便利的自动化,但带来的行业格局演变也正引起从业者的警惕。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数据标注进入自动化的第三代8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“基于模型训练、减少人工标注,数据集应该是更加可拓展(scalable)、成本可负担(affordable)的。”5月末在上海,Holger向南方财经全媒体记者讲述了他开发三代自动驾驶数据集的经历。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在自动驾驶数据集起步之初,数据采集的小时数、车辆行驶区域等均受到限制,而且所有的标注全由人力操作。第一代数据集nuScenes正是如此,它采样于波士顿和新加坡,总时长仅有5.5小时。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尽管如此,这已经包含大量信息。这短短数小时的素材获取了1000个场景,同时涵盖北美洲和亚洲城市不同的路况和天气,也同时覆盖了左行和右行交通规则,其中,多雨的新加坡给数据标注带来了相当大的挑战。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

nuScenes也是全球首个全感应的数据集,这意味着它并非仅依靠相机或激光雷达采集数据,而是结合了二者以及雷达、GPS和IMU(惯性测量单元)数据。这个数据集最终包括140万张图片,其中在4万张关键图片中包含140万个标注框。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

从2016年到2019年,全球不同机构采集均使用人工方法为自动驾驶数据集进行标注,nuScences的标注量已经足够说明,人工方法下的数据集建立有场景数量天花板(通常不超过1000个),而且开发时间长、人工培训成本高。尽管如此,初代数据集的开发令自动驾驶研发打开了局面。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

第二代数据集nuPlan是全球第一个大规模的规划型数据集,这一代数据加强了标注阶段的自动化,将数据集的小时数从5小时水平提升到1000小时以上。数据最终采集自波士顿、匹兹堡、拉斯维加斯和新加坡,包含1282个小时的行车数据。使用如此大的训练量,将数据集能力从感知(perception)提升到了规划(planning),也意味着将自动驾驶技术从低等级的辅助驾驶进一步提升到了自动驾驶能力。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

和上一代数据集不同的是,nuPlan将离线和实时数据进行了结合,利用离线感知(offline perception)进行了场景标记和交通灯模拟,更适合用于自动驾驶规划(planning)和预测(Prediction)。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

然而,底层离线感知系统仍然需要人力标注,这仍然导致数据集昂贵且耗时。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,Holger 设想第三代数据集将几乎不需要人类标注工作,这样可以极大降低数据集开发成本,并进一步提升可拓展性。“目前,全球仅有少数超大公司可以负担自动驾驶数据集开发,我希望能将AI开发进一步普及化,激发小公司和创新公司利用AI的能力。”Holger称。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

第三代数据集利用主动学习(active learning)、自监督学习(self supervised learning)、基础模型(foundation model)和语言模型(language model)等技术,这些方法可以将人力标注工作降低数个数量级,大约是上一代技术标注量的1/20至1/100。它还能灵活地适应新车辆、新城市等变量,未来可以开发有关自行车、火车和船只的新数据集。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“未来,数据集开发方法还可以进一步应用到机器人、无人机、卫星、安防等领域。”Holger表示,这意味着自动驾驶领域的又一新技术将带来新的行业革命。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人工智能令从业者兴奋8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人工智能为自动驾驶解决了一个又一个难题,令后者不再只是一个封闭场景里的幻想,而更可能在未来于广阔世界里成为现实。作为从业者,从2022年下半年开始的人工智能浪潮令他感到兴奋,同时新格局变化也令他产生了一些警惕。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先是基础模型经由“转换器(transformer)”改造以来,变得更加强大,适应大规模的神经网络模型建立,并产生了不少震撼市场的大语言模型和多模态模型。“Transformer的到来让人惊叹,它把数据集提升到了一个高得多的量级,分析能力也更强劲了。”Holger指出。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Transformer是一种新型神经网络,大众熟知的ChatGPT、GPT系列模型、BERT模型等正是基于transformer开发的。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

目前,全球基础模型仍在不断开发,而这给数据标注带来了更多便利。Holger表示,这是因为基础模型能让图片训练适用于所有条件,也就是说,当天气、城市、摄像头等条件变化时,模型仍能自动训练。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着大语言模型在全球范围的流行,Holger认为这也可以给数据标注行业带来更多便利。“设想使用自然语言进行数据标注,例如对一张图片进行所有车辆标注,还能进一步修改标注目标,例如将图片中的卡车排除标注,这会令数据标注更加方便。”Holger称。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除此以外,数据集训练也在更趋人道、环保和节能。由于在第三代数据集中使用自监督学习和主动学习,标注量成倍缩小。“从算力的角度,这更加高效,也意味着更节能环保。”Holger称,另外,数据标注行业从前几乎等同于“低薪高压”工作的代名词,未来也可能缩小这种工作量,转而增强职业训练技能。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,新的模型训练也将覆盖更多的“边界情况(corner case)”,即那些不常见但对自动驾驶安全至关重要的场景,令自动驾驶真正从实验室里走到现实道路中。“在第三代技术中,我们正试图通过结合无监督学习去抓捕混合的车辆等,从而覆盖更多的‘边界’。”Holger称。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,部分人工智能科技的发展正在悄然改变行业格局,这给从业者带来了一些关于未来的隐忧。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

算力硬件设备明显变得更加昂贵、供不应求,这是因为超大型人工智能公司正在囤积算力芯片,而部分公司拥有供应相关芯片的垄断地位。“未来的算力市场上,应该有更多公司供应算力芯片,而非只有一两家。”Holger表示。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,“尽管基础模型的通用性非常强大,但这可能导致技术掌握在个别超大公司手中,这对于其他也在开发基础模型的创新机构不利。”Holger称。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,Holger对大学和创新型研究机构在人工智能中的角色保持信心。“大型商业机构并不总是关心人工智能技术发展,因此这是我们(大学)发挥创新之处,我们也将把现有商用人工智能变得更加高效节能。”Holger称。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

商用AI可能会追逐周期浪潮,资金总是在行业高峰期进行堆积,但在行业低谷期撤退。Holger认为,人工智能发展也应该更加理性,一些热潮还需要时间验证。8xN速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:AI浪潮下的数据:自动驾驶需要何种标注?|GAI进化论http://www.sushuapos.com/show-2-6360-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 我国中医药科技成果登记流程进一步优化

下一篇: 英伟达H20“退烧” 国产GPU向前

热门资讯

推荐资讯

  • 大型险企加码员工持股,人才争夺升级?

      中新经纬10月16日电 (李自曼)近期,中国平安、泰康保险、阳光保险陆续推出或升级员工持股计划,引发市场关注。  员工持股计划,被业界称为“金手铐”制度。早在2015年,保险

  • 钱江摩托被冻结9177万元股权

      中新经纬10月16日电 国家企业信用信息公示系统显示,近日,浙江钱江摩托股份有限公司(下称:钱江摩托)新增4条股权冻结信息,冻结股权数额合计9177万人民币,股权所在企业为钱江摩

  • A股低开 充电桩概念股逆市拉升

      中新经纬10月16日电 16日,A股三大股指低开,上证指数跌0.29%报3900.68点,深证成指跌0.42%报13064.26点,创业板指跌0.58%报3008.37点。  盘面上,海运、教育、航天军工等板块

  • 标普500指数收涨0.4%,LVMH集团大涨超12%

      中新经纬10月16日电 美股三大指数高开低走,盘中集体跌绿,截至收盘,道指跌0.04%,纳指涨0.66%,标普500指数涨0.4%。  来源:Wind  大型科技股多数上涨,谷歌涨超2%,特斯拉、脸书

  • 上纬新材复牌后跌33%,第9次发股票交易异常波动公告

      中新经纬10月15日电 复牌后股价连续3日下跌,上纬新材15日盘后发布股票交易异常波动公告。  公告称,公司已关注到近期市场存在部分媒体关于上纬新材与实际控制人邓泰华

  • 美股尾盘小幅跳水,英伟达跌超4%

      中新经纬10月15日电 美股三大指数低开后震荡回升,尾盘小幅跳水,截至收盘,道指涨0.44%,纳指跌0.76%,标普500指数跌0.16%。  来源:Wind  大型科技股多数下跌,英伟达跌超4%,亚

  • 两部门紧急预拨8000万元支持桂滇豫防汛应急抢险救灾

      中新经纬10月14日电 据财政部网站14日消息,财政部、应急管理部紧急预拨8000万元中央自然灾害救灾资金,支持桂滇豫做好防汛应急抢险救灾工作。  近期,广西、云南、河南多

  • 外媒:三星电子三季度营业利润同比增31.81%

      中新经纬10月14日电 据韩联社报道,三星电子14日披露业绩数据,核实公司第三季度营业利润(按合并财务报表口径计算)为12.1万亿韩元(约合人民币605.21亿元),同比增长31.81%。

  • 商务部就近期美方宣布对华加征关税等限制措施答记者问

      中新经纬10月14日电 据商务部网站消息,商务部新闻发言人就近期美方宣布对华加征关税等限制措施答记者问。  有记者问:近日,美方官员称,在得知中方对稀土等相关物项采取出

  • 三大电信运营商eSIM手机商用试验获批

      中新经纬10月13日电 三大电信运营商同日官宣eSIM手机商用试验获批。  “中国联通”公众号截图  据“中国联通”公众号13日消息,近期,中国联通正式获得开展eSIM手机

  • 2025年诺贝尔经济学奖揭晓,3位获奖者什么来头?

      中新经纬10月13日电 当地时间10月13日,瑞典皇家科学院宣布,将2025年诺贝尔经济学奖授予乔尔・莫基尔(Joel Mokyr)、菲利普・阿吉翁(Philippe Aghion)和彼得・豪伊特(Peter

  • 晶方科技:荷兰子公司不存在控制权被冻结风险

      中新经纬10月13日电 13日盘后,晶方科技在上证e互动平台答复投资者提问称,公司荷兰子公司不存在控制权被荷兰冻结的风险。  当日,有投资者提问:近日闻泰科技旗下主体安世半

  • 日榜
  • 周榜
  • 月榜