3月 26

基因组的坐标系统:0-based与1-based

在现实生活中,我们经常会遇到从0开始计数还是从1开始计数的问题。此处先从现实生活中的实例说起,过渡到电脑编程,然后再详细解释基因组的坐标问题,最后列出一些有用的网址,感兴趣的可以继续阅读、加深理解。

  • first floor的问题

In British English the floor of a building at street level is the ground floor and the floor above that is the first floor.
在英式英语中, 楼房地面与街道相平的楼层叫ground floor, ground floor上面的一层叫first floor.

In US English the street-level floor is the first floor and the one above is the second floor.
在美式英语中, 与街道相平的楼层叫first floor, 其上面的一层叫second floor.
注:以上解释来源于《牛津英汉双解美化版》。
Continue reading

3月 09

bedtools:灵活而强大的基因组数据处理套件

  • 简介

bedtools总共有二三十个工具/命令来处理基因组数据。比较典型而且常用的功能举例如下:
格式转换,bam转bed(bamToBed),bed转其他格式(bedToBam,bedToIgv);
对基因组坐标的逻辑运算,包括:交集(intersectBed,windowBed),”邻集“(closestBed),补集(complementBed),并集(mergeBed),差集(subtractBed);
计算覆盖度(coverage)(coverageBed,genomeCoverageBed);
此外,还有一些强大而实用的工具(shuffleBed,groupBy,annotateBed,……)。……【阅读全文】