近日,中国科学院北京基因组研究所(国家生物信息中心)高远团队与动物研究所赵方庆团队,开发出面向TB级转录组数据的高效环形RNA检测与定量工具CIRI3,通过反向剪接序列比对与跨样本整合算法设计,实现了TB级数据的超高速处理,并可高灵敏识别低丰度及非传统剪接信号的新型环形RNA,突破了环形RNA大规模检测方法的灵敏度与计算效率瓶颈。
针对现有环形RNA计算工具效率低、内存占用大等问题,CIRI3采用动态多线程任务划分与分块查找策略,实现了TB级测序数据的超高效处理(处理21TB SAM文件仅需105小时,峰值内存占用45.85 GB)。CIRI3可实现对大规模样本的联合分析。相较于单一样本分析,联合分析可有效防止“漏检”,使得环形RNA的检出率提升19.3%,并提升了低丰度环形RNA的检测灵敏度与定量精度。同时,CIRI3对非经典剪接信号等关键特征具有高度的可扩展性,实现了对内含子自连接型环状RNA等新亚型的系统性识别。综合性能评估表明,CIRI3在环形RNA的识别与定量方面均优于现有工具,可为大规模环形RNA研究及疾病生物标志物的挖掘提供技术支撑。
基于CIRI3的大规模数据挖掘能力,研究团队对涵盖30种癌症类型的2535个人类癌症及正常样本转录组测序数据进行整合挖掘,构建出迄今规模最大的AI-ready肿瘤相关环形RNA数据资源CIRIonco。评估表明,CIRI3计算的环形RNA剪接比率在不同批次和不同来源的样本间表现出高度的稳健性,其批次效应低于传统的反向剪接读段数,使其成为跨批次、跨平台整合分析的更优指标。进一步,基于差异剪接的环形RNA,团队构建了基于人工智能的组织类型溯源与疾病表型预测模型,实现了样本来源器官系统、组织类型及疾病水平的精准预测,展示了环形RNA作为疾病分子分型与早期诊断生物标志物的潜力。该模型可在用户小规模数据集上迁移学习,实现优于从头训练模型的预测性能,为解析环形RNA的生成调控与功能机制提供了计算工具。
CIRI3是可在TB级人群队列转录组数据中高效检测和精确定量环形RNA的工具;CIRIonco数据库为癌症相关环形RNA的研究与功能探索提供了AI-ready数据集与计算模型,并为环形RNA在癌症分型和精准诊断中的应用提供了方法学工具和数据基础。
相关研究成果发表在《自然-生物技术》(Nature Biotechnology)上。研究工作得到国家重点研发计划、国家自然科学基金、中国科学院战略性先导科技专项等的支持。
论文链接
CIRI3源代码、在线分析网页
CIRIonco数据库
CIRI3方法原理
CIRIonco数据库及组织类型溯源与疾病表型预测模型
党的十八大以来,我国教育对外开放积极谋求更高质量发展,取得显著成效,已成为推进教育强国建设的重要引擎。通过不断完善教育对外开放总体布局,统筹规划、重点推进,我国逐步形成了更全方位、更宽领 城区学校在开展劳动教育时常常面临劳动教育资源不足、劳动场地受限等问题。长沙市长郡芙蓉中学是—所城区学校,校园面积仅29亩,学生达到2100余人。为了满足学生的劳动实践需求,学校在建设和 办好学前教育、实现幼有所育,关系亿万儿童健康成长,关系千家万户的切身利益,关系国家和民族的未来。在以中国式现代化全面推进教育强国建设的新征程上,颁布学前教育法,标志着学前教育进入“有专门 中国教育报-中国教育新闻网讯(通讯员 田雨)日前,主题为“教育幸福感·如何与自然保持连接”的第五届中国丹麦幸福教育大会在山东高密莫言文学艺术馆举行。大会由中国教育三十人论坛和丹麦终身学 一、成立背景随着全球科技革命和产业变革加速演进,大力发展职业教育、培养高素质技能人才已成为各国教育的优先任务和共同目标,各国职业教育之间的交流往来和学习互鉴也越发频繁和密切。中国政 摘要:近年来,中学生面临着多方面的压力,包括学习压力、人际关系压力、抗压和挫折适应能力问题等。这些问题对学生的心理健康产生了不良影响,导致部分学生出现焦虑、抑郁等心理问题。本文从关注传 。本文链接:研究开发出高效环形RNA检测与定量工具http://www.sushuapos.com/show-12-1888-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。