1月 12

【文献推荐】如何教/学R

2009年8月的PLoS Computational Biology上发表了一篇名为《向计算生物学专业的学生教授R语言的简明指导》的文章。虽然作者是以老师的身份来讲解的,但对于学习R的同学来说同样大有裨益。

作者先简单说明了一下为什么计算生物学专业的同学需要学习、使用R?最主要的原因在于R中的Bioconductor项目。之后作者分条列目得“详述”了如何向学生教授R。其中包括课程、书籍、网络资料,适用于练手的计算生物学问题,如何用R画图,R中的可重复研究——Sweave(LaTeX与R的结合),以及R中经常遇到的问题。在最后一部分,作者介绍了几个典型的问题,如:语法错误、变量的预赋值、向量化(即如何避免循环)、向量化的简单实例、数据类型的选择。文章的最后,作者对文章进行了非常简单的总结。

Continue reading

1月 11

【文献推荐】多重假设检验中的p值校正

在生物学特别是基因组学的研究工作中,经常会遇到多重假设检验(multiple testing)的问题;此时,得到的原始p值需要进行校正后才能使用,那么哪种校正方法更加适合自己的研究工作呢?p-values, false discovery rates(FDR) 和 q-values有什么不同?它们分别代表什么意义?

对于统计科班的同学来说,这不过是小菜一碟;但对于纯生物出身的同学来说,别说去看公式了,光是听听就觉得头大!不过幸运的是,有牛人(William S Noble)了解我们的苦衷,于是一篇nature biotechnology的文章诞生了——《How does multiple testing correction work?》。

Continue reading