##测试环境
在64位Ubuntu 12.04(内核:3.2.0)桌面环境下,使用第1代360随身WiFi测试成功!……【阅读全文】
Tag Archives: 脚本
[荐]增强版cd导航
z是一个相当实用的cd命令增强脚本,目前支持bash和zsh。使用z,我们能够在Linux命令行实现更加快速的导航。……【阅读全文】
[荐]explainshell和ShellCheck
explainshell
explainshell: write down a command-line to see the help text that matches each argument (support for control flows (if/while/etc.) and command substitutions will be added later on)……【阅读全文】
人类基因组中的基因密度、特征长度和SNP密度
一、源起
本周,在为本科生设计生物信息学实验的时候,突发奇想,想要利用Galaxy工具计算一下人类基因组的常识性信息,如:每条染色体上的基因密度,外显子、内含子等特征(feature)的平均长度,SNP在UTR、编码区、内含子等不同特征区域的密度。
二、工具
系统平台:Linux(Ubuntu 12.04,AMD64)。
UCSC Table:下载基因组数据至本地。
Galaxy:用于在线处理基因组数据。
BEDTools(v2.16.2):用于本地处理基因组数据
R(v2.15.1):绘制图表。
其他:Vim(v7.3.429)。
三、数据库
human genome:hg19
dbSNP:135
四、结果
1.基因在每条染色体上的数目与密度。
- 数据表格
chromosome | length.bp | length.100kb | geneNumber | geneDensity.numberPer100Mb |
---|---|---|---|---|
chr1 | 249250621 | 2492.50621 | 4177 | 1675.82330718 |
chr2 | 243199373 | 2431.99373 | 2563 | 1053.86784858 |
chr3 | 198022430 | 1980.2243 | 2251 | 1136.73991376 |
chr4 | 191154276 | 1911.54276 | 1592 | 832.835149343 |
chr5 | 180915260 | 1809.1526 | 1739 | 961.223503203 |
chr6 | 171115067 | 1711.15067 | 2071 | 1210.29669468 |
chr7 | 159138663 | 1591.38663 | 1940 | 1219.06264853 |
chrX | 155270560 | 1552.7056 | 2083 | 1341.5292635 |
chr8 | 146364022 | 1463.64022 | 1437 | 981.79865541 |
chr9 | 141213431 | 1412.13431 | 1573 | 1113.91670669 |
chr10 | 135534747 | 1355.34747 | 1749 | 1290.4439922 |
chr11 | 135006516 | 1350.06516 | 2485 | 1840.65189861 |
chr12 | 133851895 | 1338.51895 | 2102 | 1570.39241021 |
chr13 | 115169878 | 1151.69878 | 711 | 617.348921738 |
chr14 | 107349540 | 1073.4954 | 1334 | 1242.66950748 |
chr15 | 102531392 | 1025.31392 | 1357 | 1323.49710028 |
chr16 | 90354753 | 903.54753 | 1600 | 1770.79782399 |
chr17 | 81195210 | 811.9521 | 2331 | 2870.85900757 |
chr18 | 78077248 | 780.77248 | 599 | 767.188925511 |
chr20 | 63025520 | 630.2552 | 1167 | 1851.63089491 |
chrY | 59373566 | 593.73566 | 347 | 584.435167664 |
chr19 | 59128983 | 591.28983 | 2716 | 4593.34807095 |
chr22 | 51304566 | 513.04566 | 924 | 1801.00929028 |
chr21 | 48129895 | 481.29895 | 534 | 1109.49753786 |
- 条形图展示
Continue reading
[荐]一些实用的生信程序和脚本
University of Alberta的Stothard Research Group主页上有一些很好的生物信息学程序和脚本,如:……【阅读全文】
[转]Linux Shell学习与实践系列
在Linux Today上有一系列Linux Shell学习与实践短文,现汇总如下。
此主题的内容仍在继续更新中,有兴趣的朋友可以持续关注Linux Today。
-
Linux Shell学习系列
linux crontab应用和实例
linux命令基础:文件和目录的操作命令
yum常用命令介绍和yum源下载
Linux命令基础:用户、组管理命令
Bash shell的十个技巧提升linux操作效率
linux系统的命令使用规范
文件显示命令:cat、more、less、tail、touch详解
Shell的使用简述
改变文件或目录存取权限命令: chown,chmod,umask
联机帮助命令:man、help
有关进程管理的命令:ps、kill、sleep
linux中用date命令获取昨天、明天或多天前后的日期
较完整的Bash快捷键,让命令更有效率
linux shell 脚本中”2>&1″的含义解释
Linux常用命令大全速查备忘
Linux sed 批量替换字符串和更多用法
Linux下2种定时执行任务方法
Linux Shell 脚本编程速查笔记<上>
Linux Shell 脚本编程速查笔记<下>
Linux Shell 编程常用技巧、实例(一)
Linux Shell 编程常用技巧、实例(二)
Linux Shell 编程常用技巧、实例(四)
Linux Shell 常用命令总结
Continue reading
把一个文件复制到多个目录的Shell脚本
39be3b7a5026753003c08b99f5c151f0003……【阅读全文】
查找删除重复文件的Perl脚本
-
注意
此程序未经广泛测试,请谨慎使用。……【阅读全文】
实用的SHELL脚本
-
实际问题
假设有成百上千个GEO数据文件,每个文件中都有好多行的基因表达数据,文件的第一列是NCBI geneid。现在想从这许多GSE中提取出每个geneid的基因表达量,即根据geneid来对原始数据进行分组。如何实现呢?下面是使用shell的一种解决办法。……【阅读全文】