kaiyun开云如果基因编辑像用剪刀裁剪DNA序列,那么如何让这把“剪刀”更精准、更高效?
最近,中国农业大学赵海楠团队开发了一款名为Cas12Fold的深度学习框架,专门用于精准预测CRISPR-Cas12家族蛋白的三维结构,克服了通用结构预测模型在处理此类高多样性蛋白时的局限性,为基因编辑工具的理性设计与优化提供结构基础。相关成果以

自CRISPR基因编辑技术问世以来,它已成为生命科学领域最强大的工具之一。除了广为人知的Cas9,Cas12蛋白近年来备受关注。它体积更小、无需tracrRNA、具备非特异性单链DNA切割活性,在基因治疗、农业育种等方面展现出巨大潜力。然而,想要理性改造并优化Cas12蛋白,首先必须看清它的三维结构。传统的实验方法如冷冻电镜成本高、周期长,而通用结构预测工具(如AlphaFold2)在面对序列多样性高、同源性低的Cas12亚型时,往往因无法提取足够的共进化信息而导致预测精度不足。
为解决上述问题,研究团队在AlphaFold2架构基础上,通过引入针对Cas12家族特性的三大优化策略,开发了Cas12Fold框架:
1. 深度进化信息挖掘:团队构建了包含约390万条序列的专用数据库 Cas12FoldDB-seq,显著扩充了多序列比对(MSA)的信息深度,解决了Cas12蛋白进化信息匮乏的问题。
2. 基于结构的模板筛选:建立了结构模板库Cas12FoldDB-struct,采用结构相似性而非单纯的序列相似性来识别关键模板,从而能够有效捕获远程同源蛋白信息。
3. 结构引导的迭代优化:引入了迭代优化机制,使模型能够利用初步预测结果进行自我修正,逐步逼近真实结构,甚至能够捕捉蛋白质在不同功能状态下的构象细节。
2. 关键区域更准:在涉及功能的关键区域,如负责靶标识别的REC结构域和负责DNA切割的RuvC结构域,Cas12Fold的预测准确性优势明显。
3. 催化中心细节还原:对于催化必需的DED基序,Cas12Fold能更准确地预测其侧链构象及微环境,为理解酶活机制提供了可靠依据。
Cas12Fold的高精度预测能力不仅提升了结构解析效率,还推动了对Cas12家族的新认知与实际应用:
1. 精准结构准确捕捉Cas12家族进化:研究团队利用Cas12Fold分析了106个AlphaFold2难以预测的Cas12蛋白(dtp-Cas12s)。结果发现,其中一类蛋白(dtp-Cas12.I)虽然序列差异大,但在C端结构域上与Casλ蛋白高度相似。这一发现提供了更精准的Cas12分类系统,有助于理解Cas12家族的进化历程。
2. 指导理性设计:研究团队选取了预测难度高的Cas12j.4进行验证,Cas12Fold给出了高置信度(77.9)的结构模型,而其他工具的得分普遍低于60。通过分析这一高精度模型,研究团队识别出Cas12j.4中可能与DNA结合的关键区域,并基于结构相似性原则,从已知功能的Cas12o1蛋白中引入N608R突变。实验验证表明,该突变体在人类细胞中的基因编辑效率提升了3.3倍。
Cas12Fold的成功表明,在通用AI模型基础上针对特定蛋白家族进行垂直领域的深度优化,是解决复杂生物大分子结构预测难题的有效路径。该方法未来有望扩展至Cas9、TnpB等其他CRISPR系统乃至更多蛋白家族,为合成生物学和结构生物学研究提供更精准的计算工具。
中国农业大学分子设计育种前沿科学中心和农学院赵海楠研究员、杨志佳副研究员为该论文的共同通讯作者。博士后徐峰(现为北京市农林科学院杂交小麦研究所副研究员)、博士生赵子龙和硕士生刘畅为论文共同第一作者。博士生余镁霞、李可、景以林和李沛洋对该工作顺利实施起到重要贡献。赖锦盛教授、鄂立柱副教授、辛蓓蓓副教授、陈建副教授对该工作提供了重要的指导和帮助。

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
俄驻委大使披露详情:马杜罗及妻子被控制时,身边实际上没有任何人;防空系统的远程预警站通信出了问题
苏州多地突闻巨响,窗户震动,像“炸雷”!相关部门回应:非爆炸事故,原因正调查
初代网红品牌关店超百家、退出多地市场!经典产品风靡一时,产业总量开始压缩
前一天促销,后一天闭店!记者调查“洗脸熊”门店跑路背后:明星代言难掩预付卡监管“黑洞”