【6.1.1】遗传变异

最近开始接触NGS了,每天听带头大哥谈各种变异,却总是缺少一个系统的概念,今天我们就一起来聊聊什么叫遗传变异吧。

遗传突变来自3个方面:

  • 遗传自父母;
  • 新发突变(de novo nucelotide mutation,即我们父母没有的突变);
  • 体细胞突变(著名的例子是癌症,肿瘤细胞一般都会有模中体细胞突变,会导致细胞不受控制地增殖)。

几个容易搞混淆的词: mutation ,polymorphism,variation,variant  突变,多态性,变异

  • mutation:在整个踢球上所有对人群中,小于%1的这种突变,大家把它通称为突变
  • polymorphism: 如果超过1%的这种变异,大家把它叫做~,有时用5%这个cutoff
  • variation,variant:一般是mutation和polymorphism的统称

就人而言,基因突变有以下几种:

  • Chromosomal aneuploidy
  • Structural Variations (SVs)
  • Copy Number Variations (CNVs)
  • Short insertion/deletions (indels)
  • Single Nucleotide Variations (SNVs)

一、 染色体倍数增加

最熟悉的例子是唐氏综合症,21号染色体上有3条,这些孩子的智力和一些身体的特征都有很多异常的表现

二、structral variation和copy number variation

如上图所示,包括,insertion,deletion,duplication(包括紧挨着的tandem duplication和距离相对较远的这种interspersed duplication),染色体上的inversition和translocation

    短的插入删除(indel)可能在基因间区或是在内含子区,多数时候对表现的影响不是很大,但这不是绝对的。它还有可能在编码蛋白的编码区,如果在编码区它又会有两种可能的结果,一种导致frameshift(丢失或增加非3的倍数的碱基,导致整条链的位移,它就会编码一个完全不同的肽段,不光是这个蛋白的序列完全改变,它会在后面引入一个pre-mature stop codon,所以会提前出现一个终止密码子,那么这个蛋白就不会被翻译出来),一种不会导致frameshift

三、 SNV单核苷酸变异

在我们人的基因组是很常见的,一般来说每个人的基因组都会有300万个单核苷酸的变异相当于1/1000这样的一个频率,它可能出现在基因间区,或内含子区,也有可能是出现在启动子区。在基因区,它有可能出现在UTR,有可能是在内含子,也可能在编码区,也可能在非编码RNA区域。

编码区:

a,最严重的后果是它会引入一个stop codon,这样这个蛋白会提前终止,或者这个蛋白无法搬移出来,或者会翻译出来出来一个截短的一个一个版本。这个我通常叫做stop gain或者nonsense mutation;

b,它有时会造成一个终止密码子的缺失(stop loss),那就是它最后这个蛋白会比原来的蛋白更长,但同时也有可能它无法被翻译;

c,影响氨基酸的变异,叫做missense mutation或者是non-synonymousmutation,它是造成这个mi changes;

外显子区:

d,还有一些在外显子区,又是编码蛋白的外薪资区发生的这个变异,但是它因为这个codon,他是degenerative,所以它有一些是synonymous,就是不引起氨基酸的改变,也叫做silient mutaion

外显子和内含子交界处:

e,最后在内含子和外显子交界的地方,有的变异会影响剪切,也会对蛋白造成很严重的影响。

讨论

missense mutation(non-synonymous)非同义突变是目前研究最多的 ,主要的原因是它会改变氨基酸,也就是改变蛋白的序列。虽然加起来不到人的基因组的2%

参考资料

北大高歌老师的生物信息课程

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn