近日,中国科学院自动化研究所李国齐和徐波团队与相关单位合作,推出类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0)。该模型基于团队原创“内生复杂性”理论,在国产千卡GPU算力平台上完成全流程训练和推理,实现大模型在超长序列推理上数量级的效率和速度提升,展现出构建国产自主可控的新型(非Transformer)大模型架构生态的可行性。研究团队开源了SpikingBrain-1.0-7B模型,开放SpikingBrain-1.0-76B测试网址,同步公开经工业界大规模验证的类脑脉冲大模型SpikingBrain-1.0中英文技术报告。
当前主流的Transformer模型存在固有缺点,即训练时开销随序列长度呈平方级增长,推理时显存占用随序列长度线性增加,造成资源消耗,导致其处理超长序列能力受限。
研发团队借鉴大脑神经元内部复杂工作机制,提出“基于内生复杂性”大模型构架方式,打造类脑脉冲大模型“瞬悉1.0”,在理论上建立脉冲神经元内生动力学与线性注意力模型之间的联系,揭示现有线性注意力机制是树突计算的特殊简化形式,展示出一条不断提升模型复杂度和性能的新型可行路径。进一步,研发团队构建并开源了基于脉冲神经元、具有线性及混合线性复杂度的新型类脑基础模型,开发出面向国产GPU集群高效训练和推理框架、Triton算子库、模型并行策略、集群通信原语。
SpikingBrain-1.0在多个性能方面实现突破:实现极低数据量高效训练、实现推理效率数量级提升、构建国产自主可控类脑大模型生态、提出基于动态阈值脉冲化的多尺度稀疏机制。
这是我国首次提出大规模类脑线性基础模型架构,并首次在国产GPU算力集群上构建类脑脉冲大模型的训练和推理框架。其超长序列处理能力在法律与医学文档分析、复杂多智能体模拟、高能粒子物理实验、DNA序列分析、分子动力学轨迹等超长序列任务建模场景中具有显著的潜在效率优势。
相关链接:
网络端的试用端口
英文技术报告
中新社香港11月11日电在香港特区政府教育局推动下,应用科学大学联盟11日正式成立。联盟创会成员为4所专上院校,香港都 左图:戴志龙进行课堂教学的场景。资料图片《植被》(高一地理)执教者:戴志龙扫描二维码 即可观看 人物介绍 戴志龙,福建省漳州市教师进修学院初中地理教研员,正高级教师,入选教育部“ 中国教育报-中国教育新闻网北京11月11日讯(记者 林焕新)今天,教育部召开新闻发布会,解读《中华人民共和国学前教育法》并介绍教育系统学习宣传贯彻落实法律有关情况。针对用法律规范幼儿园和小学 中国教育报-中国教育新闻网讯(通讯员 田雨)日前,主题为“教育幸福感·如何与自然保持连接”的第五届中国丹麦幸福教育大会在山东高密莫言文学艺术馆举行。大会由中国教育三十人论坛和丹麦终身学 教育部办公厅关于做好“优师计划”师范生就业工作的通知教师厅函〔2024〕22号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局,部属师范大学:为贯彻落实《中共中央 国务院关于弘扬教育 “在‘推普’志愿服务活动中,我见证了普通话如何跨越地域障碍,促进经济发展与文化交流,我希望有机会继续参与其中。”近日,湖南高速铁路职业技术学院学生孔俊岩在结束志愿活动时有感而发。近期,湖 。本文链接:类脑脉冲大模型“瞬悉1.0”成功研发http://www.sushuapos.com/show-12-1751-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。