10月 13

人类基因组中的基因密度、特征长度和SNP密度

一、源起

本周,在为本科生设计生物信息学实验的时候,突发奇想,想要利用Galaxy工具计算一下人类基因组的常识性信息,如:每条染色体上的基因密度,外显子、内含子等特征(feature)的平均长度,SNP在UTR、编码区、内含子等不同特征区域的密度。

二、工具

系统平台:Linux(Ubuntu 12.04,AMD64)。
UCSC Table:下载基因组数据至本地。
Galaxy:用于在线处理基因组数据。
BEDTools(v2.16.2):用于本地处理基因组数据
R(v2.15.1):绘制图表。
其他:Vim(v7.3.429)。

三、数据库

human genome:hg19
dbSNP:135

四、结果

1.基因在每条染色体上的数目与密度。

  • 数据表格
chromosomelength.bplength.100kbgeneNumbergeneDensity.numberPer100Mb
chr12492506212492.5062141771675.82330718
chr22431993732431.9937325631053.86784858
chr31980224301980.224322511136.73991376
chr41911542761911.542761592832.835149343
chr51809152601809.15261739961.223503203
chr61711150671711.1506720711210.29669468
chr71591386631591.3866319401219.06264853
chrX1552705601552.705620831341.5292635
chr81463640221463.640221437981.79865541
chr91412134311412.1343115731113.91670669
chr101355347471355.3474717491290.4439922
chr111350065161350.0651624851840.65189861
chr121338518951338.5189521021570.39241021
chr131151698781151.69878711617.348921738
chr141073495401073.495413341242.66950748
chr151025313921025.3139213571323.49710028
chr1690354753903.5475316001770.79782399
chr1781195210811.952123312870.85900757
chr1878077248780.77248599767.188925511
chr2063025520630.255211671851.63089491
chrY59373566593.73566347584.435167664
chr1959128983591.2898327164593.34807095
chr2251304566513.045669241801.00929028
chr2148129895481.298955341109.49753786

 

  • 条形图展示

基因在每条染色体上的数目与密度
Continue reading

9月 28

第四部开源电影

消息来源:开源电影:Tears of Steel
官网链接:Tears of Steel

Blender基金会的第四部开源电影Tears of Steel(钢铁的眼泪)讲述了一群战士和科学家尝试重现一个过去的场景,试图从破坏性机器人手中拯救世界的故事。和好莱坞大片不同,这个过程包含了更多感情上的意义。

影片制作全程使用开源软件完成,包括 Libmv,GIMP,MyPaint, Krita,Inkscape 等。

扩展阅读:
三部开源电影
Blender
Big Buck Bunny
辛特尔
Continue reading

9月 26

[转]开源在中国需要什么?

原文链接:开源在中国需要什么?
信息来源:开源在中国需要什么?

导读:
GitCafe 的创始人 @ghosTM55 受邀在 Deepin Linux 用户和开发者大会上进行了发言,从教育和商业两个角度入手,阐述了对于开源社区在中国的发展问题的看法。
Continue reading

3月 16

命令行中复制移动时显示进度条

“世间最痛苦的事莫过于等待”,相信使用过Shell中cp或者mv命令操作大文件的朋友们都有这种感慨。要是能显示复制或者移动的进度,把无尽的等待变成有限的期待,那该多好呀!其实,确实有显示进度条的方法,而且方法还不止一种:

1
2
3
4
5
6
7
8
9
10
11
12
13
wget http://ftp.gnu.org/gnu/coreutils/coreutils-8.4.tar.gz
tar xvzf coreutils-8.4.tar.gz
cd coreutils-8.4/
wget http://beatex.org/web/advcopy/advcpmv-0.3-8.4.patch
patch -p1 -i advcpmv-0.3-8.4.patch
./configure
make
sudo cp src/cp /usr/local/bin/cpg
sudo cp src/mv /usr/local/bin/mvg
 
#vim ~/.bashrc
alias cpg="/usr/local/bin/cpg -g"
alias mvg="/usr/local/bin/mvg -g"

PS: An update is scheduled to be released in just three weeks, on March 24, 2012
Continue reading

3月 16

双系统安装与使用策略

如果你有至少两台电脑,比如:一台在家里用于娱乐,一台在公司用于工作,那安装与使用双系统最简单的方案就是在其中一台电脑上安装Windows,在另一台电脑上安装Linux。但如果手头只有一台电脑,又想体验或者需要使用双系统,那该怎么办呢?据我所知,至少有以下四种解决方案:……【阅读全文】

3月 08

[转]Linux Shell学习与实践系列

Linux Today上有一系列Linux Shell学习与实践短文,现汇总如下。
此主题的内容仍在继续更新中,有兴趣的朋友可以持续关注Linux Today。

  • Linux Shell学习系列

linux crontab应用和实例
linux命令基础:文件和目录的操作命令
yum常用命令介绍和yum源下载
Linux命令基础:用户、组管理命令
Bash shell的十个技巧提升linux操作效率
linux系统的命令使用规范
文件显示命令:cat、more、less、tail、touch详解
Shell的使用简述
改变文件或目录存取权限命令: chown,chmod,umask
联机帮助命令:man、help
有关进程管理的命令:ps、kill、sleep
linux中用date命令获取昨天、明天或多天前后的日期
较完整的Bash快捷键,让命令更有效率
linux shell 脚本中”2>&1″的含义解释
Linux常用命令大全速查备忘
Linux sed 批量替换字符串和更多用法
Linux下2种定时执行任务方法
Linux Shell 脚本编程速查笔记<上>
Linux Shell 脚本编程速查笔记<下>
Linux Shell 编程常用技巧、实例(一)
Linux Shell 编程常用技巧、实例(二)
Linux Shell 编程常用技巧、实例(四)
Linux Shell 常用命令总结
Continue reading