Tag Archives: 生物信息
[转]《时代》杂志评出2012年十大医学突破
原文链接:《时代》杂志评出2012年十大医学突破
美国《时代》杂志评选的各领域年度“十大”排名已于近日陆续出炉,医学领域“十大”突破也深入人心。涵盖了生命基础研究、艾滋病与癌症治疗突破、干细胞与再生医学、青少年健康等多方面公众关心的热点。……【阅读全文】
[转]2012年生物医学十大突破之首ENCODE,还有很大争议,请关注
[转]ENCODE30篇论文全摘要 聚焦人基因组功能研究
人类基因组中的基因密度、特征长度和SNP密度
一、源起
本周,在为本科生设计生物信息学实验的时候,突发奇想,想要利用Galaxy工具计算一下人类基因组的常识性信息,如:每条染色体上的基因密度,外显子、内含子等特征(feature)的平均长度,SNP在UTR、编码区、内含子等不同特征区域的密度。
二、工具
系统平台:Linux(Ubuntu 12.04,AMD64)。
UCSC Table:下载基因组数据至本地。
Galaxy:用于在线处理基因组数据。
BEDTools(v2.16.2):用于本地处理基因组数据
R(v2.15.1):绘制图表。
其他:Vim(v7.3.429)。
三、数据库
human genome:hg19
dbSNP:135
四、结果
1.基因在每条染色体上的数目与密度。
- 数据表格
chromosome | length.bp | length.100kb | geneNumber | geneDensity.numberPer100Mb |
---|---|---|---|---|
chr1 | 249250621 | 2492.50621 | 4177 | 1675.82330718 |
chr2 | 243199373 | 2431.99373 | 2563 | 1053.86784858 |
chr3 | 198022430 | 1980.2243 | 2251 | 1136.73991376 |
chr4 | 191154276 | 1911.54276 | 1592 | 832.835149343 |
chr5 | 180915260 | 1809.1526 | 1739 | 961.223503203 |
chr6 | 171115067 | 1711.15067 | 2071 | 1210.29669468 |
chr7 | 159138663 | 1591.38663 | 1940 | 1219.06264853 |
chrX | 155270560 | 1552.7056 | 2083 | 1341.5292635 |
chr8 | 146364022 | 1463.64022 | 1437 | 981.79865541 |
chr9 | 141213431 | 1412.13431 | 1573 | 1113.91670669 |
chr10 | 135534747 | 1355.34747 | 1749 | 1290.4439922 |
chr11 | 135006516 | 1350.06516 | 2485 | 1840.65189861 |
chr12 | 133851895 | 1338.51895 | 2102 | 1570.39241021 |
chr13 | 115169878 | 1151.69878 | 711 | 617.348921738 |
chr14 | 107349540 | 1073.4954 | 1334 | 1242.66950748 |
chr15 | 102531392 | 1025.31392 | 1357 | 1323.49710028 |
chr16 | 90354753 | 903.54753 | 1600 | 1770.79782399 |
chr17 | 81195210 | 811.9521 | 2331 | 2870.85900757 |
chr18 | 78077248 | 780.77248 | 599 | 767.188925511 |
chr20 | 63025520 | 630.2552 | 1167 | 1851.63089491 |
chrY | 59373566 | 593.73566 | 347 | 584.435167664 |
chr19 | 59128983 | 591.28983 | 2716 | 4593.34807095 |
chr22 | 51304566 | 513.04566 | 924 | 1801.00929028 |
chr21 | 48129895 | 481.29895 | 534 | 1109.49753786 |
- 条形图展示
Continue reading
关于EMBOSS和Galaxy的生物信息学实验课程设计
本人设计的针对本科生的生物信息学实验课程设计,包括涉及EMBOSS和Galaxy的三个题目:
- 基于 EMBOSS 平台对 *** 基因进行序列分析
- 基于 Galaxy 平台分析 *** 物种基因在基因组中的分布
- 基于 Galaxy 平台分析 *** 物种 SNP 在不同特征区域中的分布
对于每一个题目,我都记录了详细的操作步骤,对于想学习EMBOSS和Galaxy(主要是后者)的朋友可能会有所帮助。
Continue reading
Bioinformatics Links Directory
The Bioinformatics Links Directory features curated links to molecular resources, tools and databases. The links listed in this directory are selected on the basis of recommendations from bioinformatics experts in the field. We also rely on input from our community of bioinformatics users for suggestions. Starting in 2003, we have also started listing all links contained in the NAR Webserver issue.……【阅读全文】
[荐]一些实用的生信程序和脚本
University of Alberta的Stothard Research Group主页上有一些很好的生物信息学程序和脚本,如:……【阅读全文】