AI结合CRISPR精准控制基因表达
2023-07-15 来源:旧番剧

信用:Unsplash/CC0 公共领域
人工智能可以预测靶向RNA而不是DNA的CRISPR工具的靶上和脱靶活性,根据发表在Nature Biotechnology上的一项新研究。
纽约大学,哥伦比亚大学和纽约基因组中心的研究人员将深度学习模型与CRISPR屏幕相结合,以不同的方式控制人类基因的表达 - 例如轻弹电灯开关以完全关闭它们或使用调光器旋钮部分关闭它们的活动。这些精确的基因控制可用于开发新的基于CRISPR的疗法。
CRISPR是一种基因编辑技术,在生物医学及其他领域有许多用途,从治疗镰状细胞性贫血到设计更美味的芥菜。它通常通过使用一种叫做Cas9的酶靶向DNA来起作用。近年来,科学家们发现了另一种类型的CRISPR,它使用一种叫做Cas13的酶来靶向RNA。
RNA靶向CRISPR可用于广泛的应用,包括RNA编辑,敲低RNA以阻断特定基因的表达,以及高通量筛选以确定有希望的候选药物。纽约大学和纽约基因组中心的研究人员创建了一个使用Cas13进行RNA靶向CRISPR筛选的平台,以更好地了解RNA调控并识别非编码RNA的功能。由于RNA是SARS-CoV-2和流感等病毒的主要遗传物质,因此靶向RNA的CRISPR也有望开发预防或治疗病毒感染的新方法。此外,在人类细胞中,当一个基因表达时,第一步是从基因组中的DNA产生RNA。
该研究的一个关键目标是最大限度地提高RNA靶向CRISPR在预期靶RNA上的活性,并最小化可能对细胞产生有害副作用的其他RNA的活性。脱靶活性包括向导和靶RNA之间的不匹配以及插入和缺失突变。
RNA靶向CRISPR的早期研究仅关注靶向活性和错配;预测脱靶活性,特别是插入和缺失突变,尚未得到充分研究。在人群中,大约五分之一的突变是插入或缺失,因此这些是CRISPR设计需要考虑的潜在脱靶的重要类型。
“与Cas9等DNA靶向CRISPR类似,我们预计Cas13等RNA靶向CRISPR将在未来几年对分子生物学和生物医学应用产生巨大影响,”纽约大学生物学副教授,纽约大学格罗斯曼医学院神经科学和生理学副教授,纽约基因组中心的核心教员Neville Sanjana说, 以及该研究的共同资深作者。“准确的指南预测和脱靶识别对于这个新开发的领域和治疗方法将具有巨大的价值。
在他们在Nature Biotechnology上的研究中,Sanjana和他的同事在人类细胞中进行了一系列汇集的RNA靶向CRISPR筛选。他们测量了20万个靶向人类细胞中必需基因的向导RNA的活性,包括“完美匹配”的向导RNA和脱靶错配,插入和缺失。
Sanjana的实验室与机器学习专家David Knowles的实验室合作,设计了一个深度学习模型,他们命名为TIGER(通过引导RNA设计靶向抑制基因表达),该模型是在CRISPR筛选数据上进行训练的。通过比较深度学习模型和人类细胞实验室测试生成的预测,TIGER能够预测靶上和脱靶活性,优于以前为Cas13靶向向导设计开发的模型,并为预测RNA靶向CRISPR的脱靶活性提供了第一个工具。
“机器学习和深度学习正在展示它们在基因组学方面的优势,因为它们可以利用现代高通量实验现在可以生成的庞大数据集。重要的是,我们还能够使用"可解释的机器学习"来理解为什么该模型预测特定指南将运行良好,“哥伦比亚大学工程与应用科学学院计算机科学和系统生物学助理教授,纽约基因组中心的核心教员,该研究的共同资深作者Knowles说。
“我们早期的研究展示了如何设计可以敲低特定RNA的Cas13向导。有了TIGER,我们现在可以设计Cas13指南,在目标敲低和避免脱靶活动之间取得平衡,“该研究的共同第一作者,纽约基因组中心的资深科学家Hans-Hermann(Harm)Wessels说,他以前是Sanjana实验室的博士后研究员。
研究人员还证明,TIGER的脱靶预测可用于精确调节基因剂量 - 表达的特定基因的量 - 通过部分抑制具有错配指南的细胞中的基因表达。这对于基因拷贝过多的疾病可能有用,例如唐氏综合症、某些形式的精神分裂症、Charcot-Marie-Tooth 病(一种遗传性神经疾病),或异常基因表达可能导致不受控制的肿瘤生长的癌症。
“我们的深度学习模型不仅可以告诉我们如何设计一种完全敲低转录本的引导RNA,还可以"调整"它 - 例如,让它只产生特定基因转录本的70%,”哥伦比亚工程和纽约基因组中心的博士生Andrew Stirn说。
通过将人工智能与RNA靶向CRISPR筛选相结合,研究人员设想TIGER的预测将有助于避免不需要的脱靶CRISPR活性,并进一步刺激新一代RNA靶向疗法的发展。
“随着我们从CRISPR屏幕收集更大的数据集,应用复杂机器学习模型的机会越来越快。我们很幸运,大卫的实验室就在我们隔壁,以促进这种美妙的跨学科合作。而且,通过TIGER,我们可以预测脱靶并精确调节基因剂量,这使得RNA靶向CRISPR在生物医学中的许多令人兴奋的新应用成为可能,“Sanjana说。
这项最新研究进一步推进了RNA靶向CRISPR在人类遗传学和药物发现中的广泛适用性,以纽约大学团队先前的工作为基础,开发指导RNA设计规则,靶向包括SARS-CoV-2等病毒在内的多种生物体中的RNA,工程蛋白和RNA疗法,并利用单细胞生物学揭示白血病的协同药物组合。
更多信息:使用深度学习预测 CRISPR-Cas13d 引导 RNA 的靶向和脱靶活性,自然生物技术 (2023)。DOI: 10.1038/s41587-023-01830-8