在最新的科研突破中,格拉德斯通研究所与加州大学旧金山分校的杰出研究人员巧妙地将高通量实验与前沿的机器学习技术相融合,对人类脑细胞中超过10万个序列进行了详尽的分析,成功识别出150多个可能引发疾病的基因变异。

成功识别出150多个可能引发疾病的基因变异
这项研究是PsychENCODE联盟辉煌成果的一部分,该联盟汇聚了多学科领域的精英团队,共同致力于从人类大脑中挖掘出大规模的基因表达和调控数据,这些数据覆盖了多种关键的精神疾病以及不同的大脑发育阶段。
这一里程碑式的发现极大地拓宽了我们对影响大脑发育及精神疾病成因的基因变化的认知边界。相关研究成果已正式发表于2024年5月24日的《Science》期刊。
题为"Massively parallel characterization of regulatory elements in the developing human cortex"(“发育中人脑皮层调控元件的大规模并行特征分析”),该论文的发表无疑为未来的医学研究奠定了坚实的基础。
构建关于大脑发育的基因序列综合目录
这项研究精心构建了一个关于大脑发育的基因序列综合目录,为诸如精神分裂症和自闭症谱系障碍等复杂神经系统疾病的新诊断方法或治疗手段开辟了新的道路。
论文共同通讯作者Katie Pollard博士表示:“我们深入探索了DNA非编码区的序列,这些区域被推测在大脑发育和疾病中扮演着关键角色。通过功能测试超过10万个序列,我们成功识别出它们对基因活性的影响,并进一步发现了可能改变这些序列在疾病中功能的变异。”
本项研究总共揭示了164个与精神疾病紧密相关的变异,并发现了46802个在发育中神经元中表现出增强子活性的序列,这些序列能够调节并强化特定基因的功能。
Ahituv教授进一步指出,这些“增强子”为治疗由单一基因功能不足引发的精神疾病提供了潜在的策略。“许多疾病都是由于一个基因的功能障碍所导致,而我们现在可能利用这些增强子来增强这些基因的作用,从而找到新的治疗途径。”
No.1关注类器官和机器学习
除了鉴定出增强子和与疾病紧密相关的序列外,这项研究还在另外两个核心领域展现了其深远意义。首先,研究者们利用人类干细胞衍生的大脑类器官重复了部分实验,并惊人地发现这些大脑类器官是真实大脑功能的卓越模拟体。值得一提的是,在人体脑组织中检测到的多数基因变异在大脑类器官中均得到了精确重现。
Ahituv教授表示:“我们的大脑类器官表现十分出色,与人脑高度相似。随着我们将工作扩展到测试更多与神经发育疾病相关的序列,如今我们确信这种大脑类器官是研究基因调控活性的绝佳模型。”
其次,通过向机器学习模型输入海量的DNA序列数据和基因调控活性信息,研究团队成功训练计算机预测特定序列的活性。这种程序实现了“计算机上的”实验,使科学家能在实验室操作之前预测实验结果。这一策略极大地提升了研究效率,特别是在处理庞大生物数据集时,能够在资源有限的情况下更快地取得突破。
论文共同第一作者、Pollard实验室的高级研究科学家Sean Whalen博士分享道,他们使用模型训练中保留的序列对机器学习模型进行了测试,以验证其预测已知基因表达活性的准确性。
Whalen博士表示:“尽管这个模型之前从未接触过这些数据,但它却能够做出高度准确的预测,这充分显示了模型已经深刻理解了基因如何受到发育中脑细胞中DNA非编码区影响的基本原理。
这一成就预示着研究将迎来众多崭新的可能性,甚至有望预测不同变异组合如何协同作用,从而影响基因表达。”
No.2重新发现大脑
这项研究作为PsychENCODE联盟的重要一环圆满完成,该联盟汇聚了跨学科团队,致力于从人类大脑中生成涵盖多种主要精神疾病和大脑发育阶段的大规模基因表达和调控数据。
通过联盟内多项研究的发表,我们试图揭开自闭症、双相情感障碍等尚不透彻理解的精神疾病的神秘面纱,并最终推动新治疗方法的开发。
加州大学旧金山分校的博士后研究员Chengyu Deng博士,作为论文的共同第一作者,对此表示:“我们的研究为这一日益丰富的知识体系注入了新的活力,充分展示了在探究人脑发育过程中调控元件和变异的实用性,这得益于人体细胞、类器官、功能筛选方法及深度学习的综合运用。”