科技日报北京11月21日电 (记者刘霞)据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。
团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。
CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。
虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。
团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。
不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。
2023年12月11日,自然科学基金委信息科学部在北京召开“海洋移动信息网络理论与关键技术”专项项目评审会。自然科学基金 12月16日,“第六届中国行业发展高峰论坛”暨上海交通大学行业研究院五周年系列活动(上海站)成功举行。此次论坛主题为“知 中新网1月1日电 据国家地震台网官方微博消息,中国地震台网自动测定:1月1日15时10分在日本本州西岸近海附近(北纬37.98度,东 记者1月2日从中国科学院昆明植物研究所获悉,近期高黎贡山国家级自然保护区怒江管护局、贡山管护分局联合该所组成的考察 1月18日,浙江科技大学、嘉兴大学分别在杭州、嘉兴举行揭牌仪式。面向未来,两所高校提出了各自的发展目标。 浙江科技大学 关于对拟表扬2023年度甘肃省科技统计先进个人名单进行公示的通知 甘科计函〔2024〕15号 为树立典型、表扬先进, 。本文链接:压缩算法为大语言模型“瘦身”http://www.sushuapos.com/show-11-14336-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 谷歌可能被迫出售Chrome,OpenAI考虑推出浏览器
下一篇: 新理论首次精确定义单光子形状