切除引物--Bamclipper

之前切割引物用的是GATK的ClipReads,但分析数据的过程中发现,测序序列中跟引物序列匹配的部分也会被切换掉,为了 保证更好的切割测序结果中的引物,避免引入带入的测序错误,需要找一款更牛逼的工具。

一、Bamclipper介绍

Bamclipper是一款专门针对bam文件soft-clipping PCR反应的引物

官网:https://github.com/tommyau/bamclipper/blob/master/README.md

运行前先用samtools index my.bam 建立索引 同时要有samtools和parallel的存在 切掉引物后用igv来看,可以看到的确切掉了引物,但是为什么切以后文件大小变化了呢?

# Clip primers by BAMClipper
>./bamclipper.sh -b examples/SRR2075598.bam -p examples/trusight_myeloid.bedpe -n 4
# done!
# SRR2075598.primerclipped.bam and its index SRR2075598.primerclipped.bam.bai are generated.

# the new SRR2075598.primerclipped.bam should be identical to the provided example (compare checksum of alignments and ignore headers)
>samtools view SRR2075598.primerclipped.bam | md5sum
4bcec847fe46649d127767fca9c3084a  -
>samtools view examples/SRR2075598.primerclipped.bam | md5sum
4bcec847fe46649d127767fca9c3084a  -
					
# An example line of primer pair BEDPE file (an amplicon targeting ASXL1)
>grep 31022896 examples/trusight_myeloid.bedpe
chr20   31022896        31022921        chr20   31023096        31023123

二、讨论

这个工具在用的时候折腾了一会,就在于, 必须向用samtools建立索引,我的bam文件也是有索引,但是索引的名字给改了 还有一点,这个程序必须要有parallel,多进程,你懂的

参考资料

https://github.com/tommyau/bamclipper/blob/master/README.md

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn