探究某个基因的外显子覆盖度情况【直播】我的基因组87

  所以,我们可以画它的外显子覆盖图,下面是一个例子:横坐标是外显子的长度,纵坐标是测序深度,每一个小图都是一个外显子

  根据这个图,我们就可以很明显的看出,DMD基因NM_000109本的1,10-17号外显子缺失,用IGV一个个的看这些外显子区域,是同样的结果!可能是芯片捕获不到,也可能是样本本身变异,造成的段缺失。但是这个图的信息就非常有用!(当然,这个肯定不是我的啦,我很正常的哦)

  PS:请忽略上图的外显子不是按照数值的大小排序,只是因为当初我对ggplot还不是很熟悉,不知道调整factor就可以改变出图的顺序。

  这里的hg19_refGene.txt我直接从annovar的数据目录拿到的。可以看到一个基因有多个本,每个本的外显子个数不一样。如下:

  第一列是该外显子的起始终止坐标,从1到该外显子的长度。每切换一个外显子,坐标从1开始记录。一般的外显子长度在200bp左右,也有一些超长的外显子5kb及以上长度。

  最后一列是该外显子的标记,从exon:79一直倒推到exon:1,因为该基因在染色体的负链,所以外显子顺序是反着的!这一列信息用来把外显子在ggplot分面!

  比如下面这个捕获测序的,可以很明显的看到外显子区域测序深度超级高!但是第一个和最后一个外显子很明显测序深度不足,有可能是设计这个panel的人认为第一个和最后一个外显子是UTR区域,不予捕获。

  可以看到,我只是挑选了部分基因来画图,大部分都挺好的, 全部覆盖到了,但是有一个BRCA1的本的其中一个外显子看起来是缺失了。如下:

  不过BRCA1的第2,8外显子几乎没有reads覆盖,这个很诡异,但是因为这两个外显子长度小于100bp,很有可能是NGS测序技术的,所以我倒是没那么担心。

  如果大家有人类的WGS测序数据的,可以用我的方法做一个类似的图,跟我交流一下,我的邮箱是希望你可以给我一点信心,我很正常。

  地址:陕西省西安市灞桥区新寺569号唐都医院临床教学楼312室 邮箱: 联系电话 传线号 技术支持:陕西奈特星网络发展有限公司

手机正文底部

您可以还会对下面的文章感兴趣:

  • 不搞清这7个关键问题,别说你会治「幽门螺杆菌感染」
  • 上海师大与康奈尔大学两校教授联合发布菠菜栽培种基因组草图
  • 质粒提取:质粒实验常见问题分析
  • Sci Rep:突破!利用CRISPR-Cas9技术开发出帕金森疾病新型筛选工具
  • DNA提取与纯化:琼脂糖凝胶中的DNA的回收:DEAE-纤维素膜电泳
  • 最新评论