23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
算法架构方面,Genos通过“混合专家”架构,精准调度强相关“专家”算法协同处理,在汇总百亿级庞大参数时成功降低推理成本和资源消耗,让模型既强大、又好用。
测试结果显示,Genos在直接面向临床应用的致病性突变解读任务中,准确率达92%;结合科学基础模型后,准确率高达98.3%。多项综合评测结果也显示,Genos超越现有最佳水平模型。
华大生命科学研究院相关负责人说,Genos模型已在HuggingFace(抱抱脸)、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
算法架构方面,Genos通过“混合专家”架构,精准调度强相关“专家”算法协同处理,在汇总百亿级庞大参数时成功降低推理成本和资源消耗,让模型既强大、又好用。
测试结果显示,Genos在直接面向临床应用的致病性突变解读任务中,准确率达92%;结合科学基础模型后,准确率高达98.3%。多项综合评测结果也显示,Genos超越现有最佳水平模型。
华大生命科学研究院相关负责人说,Genos模型已在HuggingFace(抱抱脸)、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
今年全国两会期间,人工智能成为热点话题,“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局,一头连着行业变革与创新,“人工智能+”既是新质生产力发展的“新引擎”,也是产业和消费 民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精神的持续亢奋,该大学生还经常出现整晚不睡觉 国际天文学家团队绘制了迄今最大的三维宇宙地图,记录了大约130万个活跃类星体在空间和时间上的位置。它将成为探测类星体、暗物质晕和超大质量黑洞的强大工具。发表在最新一期《天体物理学杂 旅行推销员问题是一个经典的数学问题,也是一个组合优化问题。德国柏林弗雷大学和亥姆霍兹柏林能源与材料研究中心(HZB)科学家开展的一项新研究证明,量子计算机在解决旅行推销员问题上,相较于传统 近日,我国“主要作物丰产增效科技创新工程”重点专项“优质双季超级稻丰产增效技术研发与集成示范”项目,在湖南岳阳宣布启动。据了解,该项目主要聚焦优质双季超级稻丰产增效技术研发,着力探明双 3月25日消息,按照惯例,iPhone会在6月份的WWDC上发布iOS 18、watchOS 11、visionOS 2等全新系统。其中iOS 18比较受关注,被许多爆料者称为iOS史上最大升级。据名记Mark Gurman最新消息, iOS 18将支持 。本文链接:全球首个百亿级可部署基因组基础模型诞生http://www.sushuapos.com/show-2-14108-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 冰在二维下“织网式”结晶过程被揭示
下一篇: 向新求质|机器人这样实现“思考”