设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

压缩算法为大语言模型“瘦身”

发布时间: 来源: 中国科技网

据美国科学促进会旗下网站11月19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据美国科学促进会旗下网站11月19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。qzC速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查、规范治疗、定期随访,提高大众爱肝护肝意识, AI领域,一则重磅消息传来!最新消息,全球最知名的AI公司——OpenAI将在几个月内发布新版大型语言模型GPT-5,性能将有大幅跃升。目前,ChatGPT使用的是GPT-4大模型,去年3月份,正是这款热门聊天 在近日举行的全球AI盛会GTC(GPU Technology Conference)2024上,联想集团与NVIDIA(英伟达)宣布合作推出全新混合人工智能解决方案,帮助企业和云提供商获得在人工智能时代成功所需的关键的加速计算能   30台发动机助进阶版“鹊桥”升空  中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入预定轨道。作为公共中继星平台,“鹊桥二号” 今年3月23日是第64个世界气象日,主题是“气候行动最前线”。面对愈加频繁的极端天气和全球变暖等气候危机,减缓气候变化已刻不容缓。发展新能源是应对气候变化的重要举措之一,而气象服务对于新 3月21日,人工智能大模型赋能企业科技创新研讨会在广州召开。中国知网在会议期间发布了专利大数据智能应用产品“AI Pat+”。据中国知网相关负责人介绍,中国知网在人工智能大模型领域的深入研发 。

本文链接:压缩算法为大语言模型“瘦身”http://www.sushuapos.com/show-2-9427-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: “跨芯片”量子纠缠实现 有助建构更强大的量子计算能力

下一篇: 世界互联网大会蓝皮书显示 我国已建近万家数字化车间和智能工厂

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜