编码|美团队:新冠病毒精确完整基因注释图谱完成

美国麻省理工学院的科学家在11日出版的《自然·通讯》杂志撰文称 , 在进行了广泛的比较基因组学研究之后 , 他们绘制出了新冠病毒迄今最精确完整的基因注释图谱 , 确认了几种蛋白质编码基因 , 也发现有些基因并不编码任何蛋白质 。 此外 , 他们还分析了新冠病毒不同毒株产生的近2000个突变 , 从而能更好地评估这些突变的重要性 。
新冠病毒的基因组由近30000个RNA碱基组成 。 此前科学家已经根据与相关病毒中蛋白质编码基因的相似性 , 确定了一些能编码蛋白质的基因 。 他们认为 , 另外还有些基因能编码蛋白质 , 但它们并没有明确归类为蛋白质编码基因 。
为确定这些蛋白质编码基因 , 计算机科学和人工智能实验室的玛诺里斯·克里斯教授领导的实验团队利用自己开发出的计算技术 , 对新冠病毒、萨斯病毒和42株蝙蝠沙贝病毒亚属进行了分析 。 这一技术的基本原理是分析物种之间是否保存着某些DNA或RNA碱基 , 并比较它们随时间如何进化 , 他们此前已利用该技术比较了人类基因组与其它哺乳动物的基因组 。
结果表明 , 除发现此前已在其他冠状病毒中发现的5个基因外 , 克里斯团队还确认了新冠病毒基因组中6个蛋白质编码基因 , 而其他5个被认为能编码蛋白的基因并无此能力 。 他们表示 , 在分析了整个基因组后 , 非常确信没有其他蛋白质编码基因成为“漏网之鱼” 。 他们计划继续开展实验研究 , 以弄清这些没有特征的基因的功能 。
此外 , 克里斯团队还分析了自新冠病毒首次被发现以来 , 已经出现的1800多个突变 , 并比较了每个基因在过去的进化速度和疫情暴发以来的进化速度 。 结果表明 , 大多数情况下 , 在疫情暴发之前长时间快速进化的基因仍在继续快速进化 , 而缓慢进化的基因也保持着自身的节奏 。 不过也有例外 , 这可能有助于揭示病毒在适应新的人类宿主时是如何进化的 。
【编码|美团队:新冠病毒精确完整基因注释图谱完成】研究人员还分析了几种新冠病毒变异毒株——B.1.1.7、P.1和B.1.351等出现的突变 。 结果发现 , 许多使这些变异更危险的突变存在于刺突蛋白中 , 有助于病毒更快地传播并避开免疫系统 。 他们指出 , 每个变异毒株都拥有20多个独特的突变 , 知道哪些可能有用 , 哪些无用非常重要 , 有助于科学家专注最有可能对病毒传染性产生重大影响的突变 。

    推荐阅读