10月 13

关于EMBOSS和Galaxy的生物信息学实验课程设计

本人设计的针对本科生的生物信息学实验课程设计,包括涉及EMBOSS和Galaxy的三个题目:

  • 基于 EMBOSS 平台对 *** 基因进行序列分析
  • 基于 Galaxy 平台分析 *** 物种基因在基因组中的分布
  • 基于 Galaxy 平台分析 *** 物种 SNP 在不同特征区域中的分布

对于每一个题目,我都记录了详细的操作步骤,对于想学习EMBOSS和Galaxy(主要是后者)的朋友可能会有所帮助。
Continue reading

3月 10

biopieces:生物信息学数据处理的瑞士军刀

  • 简介(摘自官网)

The Biopieces are a collection of bioinformatics tools that can be pieced together in a very easy and flexible manner to perform both simple and complex tasks. The Biopieces work on a data stream in such a way that the data stream can be passed through several different Biopieces, each performing one specific task: modifying or adding records to the data stream, creating plots, or uploading data to databases and web services. The Biopieces are executed in a command line environment where the data stream is initialized by specific Biopieces which read data from files, databases, or web services, and output records to the data stream that is passed to downstream Biopieces until the data stream is terminated at the end of the analysis.……【阅读全文】

3月 09

bedtools:灵活而强大的基因组数据处理套件

  • 简介

bedtools总共有二三十个工具/命令来处理基因组数据。比较典型而且常用的功能举例如下:
格式转换,bam转bed(bamToBed),bed转其他格式(bedToBam,bedToIgv);
对基因组坐标的逻辑运算,包括:交集(intersectBed,windowBed),”邻集“(closestBed),补集(complementBed),并集(mergeBed),差集(subtractBed);
计算覆盖度(coverage)(coverageBed,genomeCoverageBed);
此外,还有一些强大而实用的工具(shuffleBed,groupBy,annotateBed,……)。……【阅读全文】