类脑脉冲大模型“瞬悉1.0”成功研发

发布时间: 来源：中国科学院

观看：150

近日，中国科学院自动化研究所李国齐和徐波团队与相关单位合作，推出类脑脉冲大模型“瞬悉1.0”（SpikingBrain-1.0）。该模型基于团队原创“内生复杂性”理论，在国产千卡GPU算力平台上完成全流程训练和推理，实现大模型在超长序列推理上数量级的效率和速度提升，展现出构建国产自主可控的新型（非Transformer）大模型架构生态的可行性。研究团队开源了SpikingBrain-1.0-7B模型，开放SpikingBrain-1.0-76B测试网址，同步公开经工业界大规模验证的类脑脉冲大模型SpikingBrain-1.0中英文技术报告。

当前主流的Transformer模型存在固有缺点，即训练时开销随序列长度呈平方级增长，推理时显存占用随序列长度线性增加，造成资源消耗，导致其处理超长序列能力受限。

研发团队借鉴大脑神经元内部复杂工作机制，提出“基于内生复杂性”大模型构架方式，打造类脑脉冲大模型“瞬悉1.0”，在理论上建立脉冲神经元内生动力学与线性注意力模型之间的联系，揭示现有线性注意力机制是树突计算的特殊简化形式，展示出一条不断提升模型复杂度和性能的新型可行路径。进一步，研发团队构建并开源了基于脉冲神经元、具有线性及混合线性复杂度的新型类脑基础模型，开发出面向国产GPU集群高效训练和推理框架、Triton算子库、模型并行策略、集群通信原语。

SpikingBrain-1.0在多个性能方面实现突破：实现极低数据量高效训练、实现推理效率数量级提升、构建国产自主可控类脑大模型生态、提出基于动态阈值脉冲化的多尺度稀疏机制。

这是我国首次提出大规模类脑线性基础模型架构，并首次在国产GPU算力集群上构建类脑脉冲大模型的训练和推理框架。其超长序列处理能力在法律与医学文档分析、复杂多智能体模拟、高能粒子物理实验、DNA序列分析、分子动力学轨迹等超长序列任务建模场景中具有显著的潜在效率优势。

相关链接：

网络端的试用端口

英文技术报告

生命自诞生以来一直经历着从简单到复杂，从低等到高等的演化趋势。但演化是多个方向的，有时候也会出现特化。一些科学家普　　“以中国式现代化全面推进强国建设、民族复兴，是新时代新征程党和国家的中心任务。今天，我们庆祝共和国华诞的最好行动，就是把这一前无古人的伟大事业不断推向前进。”30日在人民大会堂举行的庆祝中华人民共和国成立　　11月13日，教育部召开学习贯彻落实习近平总书记给中国国际大学生创新大赛参赛学生代表重要回信精神座谈会。教育部党组书记、部长怀进鹏出席会议并讲话。教育部党组成员、副部长吴岩主持会议。　　怀进鹏指出，习近平中国教育报-中国教育新闻网讯（记者周洪松通讯员马利）秋韵正浓时，河北保定市满城区早慧幼儿园里喜气满园，一场别开生面的“二十四节气中医智慧健康教育分享活动”于近日举行。满城区教体局于今中国教育报-中国教育新闻网北京11月11日讯（记者林焕新）“学前教育法共九章85条，短短的9000多字，浓缩了党的十八大以来学前教育跨越式发展的壮阔历程，凝聚了各地各部门大胆探索实践的宝贵经验，也寄 ◎摘要军工文化是国防科技工业系统在长期的建设与发展过程中形成的宝贵精神财富。作为中国特色社会主义文化的有机组成部分，军工文化既是军工特色高校上好“大思政课”的“活教材”，也是“ 。

本文链接：类脑脉冲大模型“瞬悉1.0”成功研发http://www.sushuapos.com/show-12-1751-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：研究揭示认知控制大脑活动随年龄呈倒U型发展轨迹

下一篇：研究利用光热空气集水实现高效自驱动生产绿氢

类脑脉冲大模型“瞬悉1.0”成功研发

热门资讯

推荐资讯

教育最热文章