3月 30

绘制图形的DOT语言简介

  1. DOT语言简介(摘抄自维基百科)

  2. DOT语言是一种文本图形描述语言。它提供了一种简单的描述图形的方法,并且可以为人类和计算机程序所理解。DOT语言文件通常是具有.gv或是.dot的文件扩展名。

    很多程序都可以处理DOT文件。其中的一些,例如dot,neato,twopi,circo, fdp与sfdp,会读取DOT文件并将之渲染成为图形格式。其它的一些,比如gvpr,gc,accyclic,ccomps,sccmap和tred,可以读取DOT文件并对它代表的图形进行一些处理。类似于GVedit,lefty,dotty和grappa则提供了交互式的界面。以上程序大部分都包括在了Graphviz软件包中。
    Continue reading

3月 26

使用BioPerl解析BLAST结果

虽然有多种多样的办法来解析BLAST,即时单单对于Perl/BioPerl来说,你可以找到好多已有的脚本,如:blast_parsing.pl。但要想灵活的控制筛选条件及输出结果,还需要自己撰写脚本或者修改别人的脚本。所有这些的前提是你对BLAST结果中的各个项目有所了解,同时要知道如何提取出自己想要的项目。……【阅读全文】

3月 21

山人何处君不见?东风一花倚阑干! ——《全唐诗》、《全宋词》统计分析报告

山人何处君不见?东风一花倚阑干!

——《全唐诗》、《全宋词》统计分析报告

一、源起

前两天看到了邱怡轩写的统计词话(一)。受其启发,决定利用自己的编程及统计分析能力,对《全唐诗》和《全宋词》进行一个较为全面的统计分析与比较。于是便有了你现在看到的这篇文章。
此处使用到的原始数据、程序脚本及结果图表等均可以在文末找到下载链接。

二、数据

《全唐诗》及《全宋词》的原始数据均来自于网络。
通过基本的编码转换以及“简单”的过滤筛选之后,就得到了用于后续统计分析的数据。

三、工具

系统平台:Linux(Ubuntu 10.10,AMD64)。
Shell命令行:转换编码(iconv)与换行符(fromdos)。
Perl(v5.10.1):用来过滤、筛选原始数据,得到可以用于后续分析的格式化数据。
R(v2.12.2):统计分析及图表绘制。
其他:Vim(v7.2.330),TimeForScience

四、结果

1.基本信息

general_info
补充:只考虑诗或词的主体内容的话,《全唐诗》共使用了7513种(个)汉字,而《全宋词》则使用了5750种(个)汉字。
此处的统计数据仅为约数,与其他的数据有一定的出入。主要原因在于原始数据的质量以及数据处理过程中的过滤筛选等。
相关的参考数据:
百度百科:《全唐诗》共收录唐代诗人2529人,诗作42863首。
玄烨为《全唐诗》所作的序中的说法:诗48900余首,2200余人。
日本学者平冈武夫的统计结果:《全唐诗》共收诗49403首,句1555条,作者2873人。
维基百科:《全宋词》收录宋代词人1330家,词作21116首。
Continue reading

3月 15

【转载】9条编程带给程序员的坏习惯;

/**
*  本文笑点很奇怪
*  请各位视自身情况筛选阅读.
*/

如果你是一个程序员, 或者你就读计算机相关专业, 那么你应该能理解下面这些诡异的小习惯是怎么养成的, 或者你本身就有着其中的某些习惯:

0. 程序员数数会从0开始数起.

例: 程序员吵架的时候会说: “我数三下, 你再不闭嘴我就不客气了! 零! 一! 二!” 或者列清单的时候编号会从0.开始写.
因:  array[0]是数组的第一个元素.
评: 这个习惯的养成是一个艰难的过程. 多少次的越界, 多少次的循环次数错误让我们深深的记住了从0开始.

1. 程序员用肯定和否定回答选择性的问题.

例: 问 “您想喝咖啡还是喝茶?” 程序员答: “嗯.”
因: 当条件或||有一个子句值为真, 则整个语句值为真.
评: 这个习惯夸张了一点, 但这的确是程序员思维方式的通病, 用计算机的处理逻辑处理人类问题. 当然这样的回答显然是存在编程错误的, 因为对于这个问题他错误的返回了布尔型的值. 虽然高度怀疑有没有人关心这种回答的结果是怎样, 还是给出一个答案. 如果真的在程序的世界里, 服务员会优先考虑给你咖啡, 如果没有咖啡了, 才会端茶给你.
Continue reading

3月 14

formatR格式化R代码

如果经常写代码,那你一定希望有一个工具可以简单得格式化代码将其美化一下。在Perl中有鼎鼎大名的perltidy,那么在R中有没有类似的工具呢?
答案是肯定的,它就是formatR(作者是谢益辉;这里是他的主页)。
formatR的使用方法如下:……【阅读全文】

3月 12

提问的智慧

英文原版
中文翻译
PDF下载

How To Ask Questions The Smart Way

提问的智慧

译者 D.H.Grand

Copyright (C) 2001 by Eric S. Raymond
中文版Copyleft 2001 by D.H.Grand(nOBODY/Ginux)

英文版:http://www.tuxedo.org/~esr/faqs/smart-questions.html
感谢Eric的耐心指点和同意,本文才得以完成并发布,本指南英文版版权为Eric Steven Raymond所有,中文版版权由D.H.Grand[nOBODY/Ginux]所有。

目录

1 简介
2 提问之前
3 怎样提问
3.1 谨慎选择论坛
3.2 尽量使用邮件列表
3.3 用辞贴切,语法正确,拼写无误
3.4 用易读格式发送问题
3.5 使用含义丰富,描述准确的标题
3.6 精确描述,信息量大
3.7 话不在多
3.8 只说症状,不说猜想
3.9 按时间顺序列出症状
3.10 别要求私下答复
3.11 明白你想问什么
3.12 别问应该自己解决的问题
3.13 去除无意义的疑问
3.14 谦逊绝没有害处,而且常帮大忙
3.15 问题解决后,加个简短说明
4 如何理解答案
4.1 RTFM和STFW:别烦我啦
4.2 还是不懂:(
4.3 面对无礼
5 决不要象个失败者
6 三思而后问
7 好问题,坏问题
8 找不到答案怎么办

Continue reading