作者 | JESSICA WRIGHT
编译 | RAY
根据对近35000个基因序列的分析,孤独症基因的数量已经从65个上升到99个。研究人员在基因之间的区域首次发现了孤独症风险变异的迹象。
这些新的发现是对来自孤独症患者及其家庭的越来越多的序列的日益复杂的分析的结果。研究人员今天在荷兰鹿特丹举行的2018年国际孤独症研究协会年会上展示了这一未发表的研究结果。
加州大学旧金山分校精神病学助理教授、联合首席研究员Stephan Sanders说:“整合数据的大规模合作有可能为我们所看到的结果提供背景。”
该分析基于从多个数据集中提取的外显子序列——基因组的蛋白质编码区域。在2015年的一项研究中,桑德斯和他的同事们收集了15000个基因序列,确定了65个与孤独症密切相关的基因。(这项分析还包括与孤独症相关的大量缺失或重复的基因。)
在他们的新工作中,该团队增加了2万个序列。桑德斯实验室的博士后助理布鲁克·谢泼德(Brooke Sheppard)说,仅这一项就把基因数量从65个增加到了79个。
随后,研究小组应用了一种更新版的统计方法,即TADA,它可以表明基因中的变异是否可能有害。
统计数据的重新启动使重要基因的数量增加到99个。这也提高了之前被列入65个基因的重要性。例如,FOXP1现在是领先的孤独症基因,而SYNGAP1几乎与前两名竞争者CHD8和SCN2A一样重要。
不过,巴黎巴斯德研究所(Institut Pasteur)的遗传学教授托马斯·布尔杰隆(Thomas Bourgeron)表示,仅仅建立一个基因列表不足以了解孤独症。布尔杰隆没有参与这项研究。他说,来自不同学科的研究人员需要一起工作,把这种疾病的各个方面分开。
桑德斯说,他计划在发表之前免费提供基因列表,这样科学家们就可以一起研究候选基因对孤独症的影响。
二次探查
在同一场会议上提出的另一项研究探讨了99%的基因组中不编码基因的风险变异。研究人员发现,在所谓的“非编码区域”的变异可能会增加孤独症的风险。
Sanders和他的同事首先研究了2076个全基因组的非编码区域。他们使用了一种严格的统计方法来校正偶然的发现,并且没有将任何非编码区域的变异与孤独症联系起来。他们在4月26日的《自然遗传学》杂志上报告了这些发现。
然后,他们对7000多个全基因组进行了重复分析。桑德斯实验室的博士后助理Joon An表示,这一数字仍然太低,不足以将任何一种非编码区域与统计意义上的孤独症联系起来。
然后,研究小组尝试了一种不同的方法:他们将一种机器学习方法应用于第一组序列,以确定基因组的哪些方面可以预测一个人是否患有孤独症。然后他们在另外5532个序列上测试了这个预测。
这项分析表明,如果在进化过程中这些区域也被保存下来,那么孤独症患者携带的超过1500个碱基对的变异并控制了基因的表达。
“它指明了前进的方向,”桑德斯说。“我们可以证明非编码基因组中存在某种东西;只是需要很大的样本容量才能找到它。”
桑德斯说,研究人员可能需要超过24000个完整基因组才能确定最相关的非编码区域。在他们尝试识别这些区域的个体变异之前,他们还需要成千上万的变异。
编译者注:这是去年的结果。昨天,该研究小组在德克萨斯州休斯顿举行的2019年美国人类遗传学学会会议上公布了未发表的结果:对自闭症患者的基因序列进行的最大规模的分析显示,有184个基因与自闭症有关,这几乎是去年估计数字的两倍。___RAY