4月 12

【转载】If You Love Somebody

  • THE ORIGINAL VERSION

If you love something,
Set it free…
If it comes back, it’s yours,
If it doesn’t, it never was yours….

  • THE PESSIMIST VERSION

If you love somebody,
Set her free …
If she ever comes back, she’s yours,
If she doesn’t, well, as expected, she never was.

  • THE OPTIMIST VERSION

If you love somebody,
Set her free …
Don’t worry, she will come back.
Continue reading

4月 03

R与分形

1.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
plot.tri <- function(n = 1000, col ="blue", ani=FALSE, cex=1.2){
    p <- runif(n);
    X <- rbind(rep(0, n), rep(0, n))
    B <- cbind(c(0,0),c(0.25,0.433),c(0.5,0))
    if(ani) plot(0,0,xlim=c(0,1),ylim=c(0,0.85),type="n",xlab="",ylab="")
    for(i in 2:n){
        pp <- p[i];
        ind <- rank(c(c(1/3,2/3,1), pp), ties.method="min")[4]
        X[,i] <- 0.5*X[,i-1] + B[,ind]
        if(ani) points(X[1,i], X[2,i],pch = ".", cex = 1, col = col)
    }
    if(!ani) plot(X[1,], X[2,],pch = ".", cex = cex, col = col, xlab="", ylab="")
}
plot.tri(100000, ani=TRUE)

sanjiao
Continue reading

4月 01

Benford law(本福特定律)

  1. 定义

  2. 本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有造假。

  3. 解释

  4. 一组平均增长的数据开始时,增长得较慢,由最初的数字a增长到另一个数字a + 1起首的数的时间,必然比a + 1起首的数增长到a + 2,需要更多时间,所以出现率就更高了。
    从数数目来说,顺序从1开始数,1,2,3,…,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,…,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。
    Continue reading

3月 27

(转)《古城荆棘王》剧情详解

序:看完《古城荆棘王》,莫名其妙得想到了《古剑奇谭》;也许两者都是建立在“一个强大的信念、一个无情的悲剧”基础之上的吧。而其中的姐姐和妹妹的关系又和《云之遥》中兰茵的分身术有几分相像……整个电影正叙与插叙、倒叙相混杂,现实与梦境、童话相交织,看完一遍很难明白到底是怎么一回事;所以在此处转载一下完全按事件发展的时间顺序来讲述的完整剧情。

此片剧情实为诡异,最后半小时尤为神棍……打破电影的顺序,按照故事的时间发展顺序,剧情应该是这样的:

几年前,一颗陨石撞击地球,陨石上附带的石化病(早在人类出现前就存在在宇宙中)也就因而开始在人类中传播。在陨石撞击的地方(俄罗斯某 村),村里的人都因为感染石化病而死去,除了一个叫爱丽丝的小萝莉。一位俄罗斯军官(维加)负责调查这个村子里的人突然全部死亡的原因,却发现伴随着石化病的出 现,村里同时也出现另外一个现象——有一个奇异的非自然进化出来的生物总是袭击、杀死人类。俄罗斯军官让手下射死了这个怪物,却发现了那个活下来的小萝莉。在进一步调查中,军官发现原来这个怪物是从小女孩的空想中产生的。后来军官认识到,小萝莉也感染了石化病而她没有死,反而因此获得了直接将想象转化成 现实的能力(当精神高度集中时),而且寿命是半永久的。
Continue reading

3月 21

山人何处君不见?东风一花倚阑干! ——《全唐诗》、《全宋词》统计分析报告

山人何处君不见?东风一花倚阑干!

——《全唐诗》、《全宋词》统计分析报告

一、源起

前两天看到了邱怡轩写的统计词话(一)。受其启发,决定利用自己的编程及统计分析能力,对《全唐诗》和《全宋词》进行一个较为全面的统计分析与比较。于是便有了你现在看到的这篇文章。
此处使用到的原始数据、程序脚本及结果图表等均可以在文末找到下载链接。

二、数据

《全唐诗》及《全宋词》的原始数据均来自于网络。
通过基本的编码转换以及“简单”的过滤筛选之后,就得到了用于后续统计分析的数据。

三、工具

系统平台:Linux(Ubuntu 10.10,AMD64)。
Shell命令行:转换编码(iconv)与换行符(fromdos)。
Perl(v5.10.1):用来过滤、筛选原始数据,得到可以用于后续分析的格式化数据。
R(v2.12.2):统计分析及图表绘制。
其他:Vim(v7.2.330),TimeForScience

四、结果

1.基本信息

general_info
补充:只考虑诗或词的主体内容的话,《全唐诗》共使用了7513种(个)汉字,而《全宋词》则使用了5750种(个)汉字。
此处的统计数据仅为约数,与其他的数据有一定的出入。主要原因在于原始数据的质量以及数据处理过程中的过滤筛选等。
相关的参考数据:
百度百科:《全唐诗》共收录唐代诗人2529人,诗作42863首。
玄烨为《全唐诗》所作的序中的说法:诗48900余首,2200余人。
日本学者平冈武夫的统计结果:《全唐诗》共收诗49403首,句1555条,作者2873人。
维基百科:《全宋词》收录宋代词人1330家,词作21116首。
Continue reading

2月 25

经典老歌

  • MP3列表(一共72首)

白雪 – 千古绝唱.mp3
曾静 – 二泉吟.mp3
陈妃平 王子鸣 – 真心和你一起过.mp3
陈妃平 – 有个人对我好.mp3
陈慧琳 – 记事本.mp3
陈明 – 快乐老家.mp3
陈明 – 我的爱对你说.mp3
陈明真 – 我用自己的方式爱你.mp3
陈升 – 把悲伤留给自己.mp3
陈星 – 流浪歌.mp3
迟志强 – 铁窗泪.mp3
Continue reading

2月 07

(转载)另类搞笑“诗词”

朕与先生解战袍,芙蓉帐暖度春宵,但使龙城飞将在,从此君王不早朝!
少小离家老大回,安能辨我是雄雌。
红酥手,黄藤酒,两个黄鹂鸣翠柳。长亭外,古道边,一行白鹭上青天。
夜深忽梦少年事,惟梦闲人不梦君。
借问酒家何处有,姑苏城外寒山寺。
洛阳亲友如相问,轻舟已过万重山。
爷娘闻女来,举身赴清池;阿姊闻妹来,自挂东南枝。小弟闻姊来,琵琶声停欲语迟。
在天愿作比翼鸟,大难临头各自飞。
美人卷珠帘,万径人踪灭。两岸猿声啼不住,惊起蛙声一片。
劝君更尽一杯酒,从此萧郎是路人。
一朝被蛇咬,处处闻啼鸟。
遥想公谨当年,小乔初嫁了,使我不得开心颜!
Continue reading