10月 08

[文献]Exome sequencing and complex disease: practical aspects of rare variant association studies

Do, R., Kathiresan, S., Abecasis, G. R. (2012). Exome sequencing and complex disease: practical aspects of rare variant association studies. Human molecular genetics, (734), 137. doi:10.1093/hmg/dds387. http://hmg.oxfordjournals.org/content/21/R1/R1.full……【阅读全文】

7月 04

R及LaTeX的入门资料

一点建议:通读《R for 初学者》;浏览《R 常见问题解答》;《R 导论》和《R语言简介》供深入学习;《R 参考卡片》供查阅。
PS1一篇很好的文献(千万不要忽视补充材料奥!)。
PS2:如果你不喜欢纯命令行的操作,推荐使用RStudio
PS3一个Sweave的实例。……【阅读全文】

1月 12

【文献推荐】生物信息学编程技能的培养

2009年12月的PLoS Computational Biology上发表了一篇名为《培养实用生物信息学编程技能的简明指导》的文章。在此推荐给生物信息学专业的学生。不管你是“菜鸟”还是“高手”,读一读此文,均将获益匪浅。用原文中的一句话来说,就是:Successful adoption of these principals will serve both beginner and experienced bioinformaticians alike in career develop- ment and pursuit of professional and scientific goals.

我根据自己的理解把文中作者的观点整理概括如下:

Continue reading

1月 12

【文献推荐】如何教/学R

2009年8月的PLoS Computational Biology上发表了一篇名为《向计算生物学专业的学生教授R语言的简明指导》的文章。虽然作者是以老师的身份来讲解的,但对于学习R的同学来说同样大有裨益。

作者先简单说明了一下为什么计算生物学专业的同学需要学习、使用R?最主要的原因在于R中的Bioconductor项目。之后作者分条列目得“详述”了如何向学生教授R。其中包括课程、书籍、网络资料,适用于练手的计算生物学问题,如何用R画图,R中的可重复研究——Sweave(LaTeX与R的结合),以及R中经常遇到的问题。在最后一部分,作者介绍了几个典型的问题,如:语法错误、变量的预赋值、向量化(即如何避免循环)、向量化的简单实例、数据类型的选择。文章的最后,作者对文章进行了非常简单的总结。

Continue reading

1月 11

【文献推荐】多重假设检验中的p值校正

在生物学特别是基因组学的研究工作中,经常会遇到多重假设检验(multiple testing)的问题;此时,得到的原始p值需要进行校正后才能使用,那么哪种校正方法更加适合自己的研究工作呢?p-values, false discovery rates(FDR) 和 q-values有什么不同?它们分别代表什么意义?

对于统计科班的同学来说,这不过是小菜一碟;但对于纯生物出身的同学来说,别说去看公式了,光是听听就觉得头大!不过幸运的是,有牛人(William S Noble)了解我们的苦衷,于是一篇nature biotechnology的文章诞生了——《How does multiple testing correction work?》。

Continue reading