课题背景和方法
[ English | 中文 ]
Goals
“RNA 而不是 DNA 才是细胞的计算引擎。” ( RNA: 掌控生命后台 | 《环球科学》 2024年7月刊封面文章)
我们围绕非编码RNA发展生物信息学技术,从结构和转录后调控(例如剪接和编辑)等多个角度、多个模型探讨非编码RNA的调控作用,并探索其在复杂疾病精准诊疗上的具体实践。我们充分发挥生物信息学这一交叉学科优势,利用最新的AI技术和多组学数据,通过和【北京协和】、【北大一院】、【清华长庚】等一线医生专家的合作,在癌症、自身免疫疾病等复杂疾病上探索新的以非编码 RNA 为表现形式的靶标。在研究其免疫调控网络的同时,部分靶标可以应用为个性化精准诊疗时的生物标志物,部分靶标可以做为药物靶点通过AI进行药物设计,在复杂疾病(如癌症和自身免疫疾病)的临床诊断和治疗两个方面实现应用价值。
Background
人类有大约2万个蛋白编码基因,但其序列的总长度仅占人类基因组总长度的1.5%左右。另一方面,人类基因组序列的~70%甚至更多都会被转录成RNA,它们很多都是非编码的RNA(noncoding RNA,ncRNA)。但对于为数众多的非编码RNA (ncRNA),我们仍然知之甚少。
”截止2020 年,ENCODE 项目已鉴定出约 37,600 个非编码RNA的基因,这几乎是蛋白质编码基因的两倍。其他统计数据相差很大,从约 18,000 个到接近 96,000 个。... 在 2024 年《科学》杂志的一篇评论中,将这些发现描述为 RNA 革命 的一部分。... 这些非编码RNA动摇了我们对生物学运作方式的理解。自从关于 DNA 双螺旋结构及其如何编码信息的划时代发现以来,分子生物学的基本思想一直是,生物体存在精确编码的指令,这些指令可以对特定分子进行特定任务编程。但非编码RNA 似乎指向了一种更模糊、更集体的生命逻辑。这种逻辑更难辨别,更难理解。但如果科学家能够学会适应这种模糊性,这种关于生命的观点可能会更加完整。“ ( RNA: 掌控生命后台 | 《环球科学》 2024年7月刊封面文章)
RNA regulation in immune system: RNA不仅在转录时被动态调控,而且在被转录后也会有着非常复杂而精细的调控工程,例如剪接,修饰,细胞定位,编辑,加尾,降解等等。而这些又和RNA自身的结构以及识别RNA序列和结构的蛋白息息相关。同时,RNA,尤其是非编码 RNA (ncRNA),还会调控其他大分子,从而在人体对病毒的免疫应答以及癌症免疫等重要生命过程中发挥作用。我们在癌症、自身免疫等复杂性疾病中探索这些复杂的调控过程,并应用于免疫治疗。
Methods
我们利用最新的人工智能技术从“序列”和“结构”两个不同的表征层面开发各类核酸模型,去发现和理解RNA在复杂的生物分子互作和调控网络中的作用和机制。

