5月 10

【旧作】红楼遗梦(观《金玉良缘红楼梦》有感而作)

之一
百世荣华陌上雪, 未经日暖欲消融。
两园钟鼎尽陷淖, 一对门狮独倚松。

之二
姑苏弱女亲门远, 金陵祸胎官路穷。
欲取花间长寿露, 误提风里薄命灯。

之三
多愁多病身如玉, 倾国倾城貌似花。
甘露三生还以泪, 至今绛草向石斜。

Continue reading

5月 10

近体诗诗韵之我见

伴随着音韵的演变,在近体诗押韵这一问题上就分成了两大阵营:一部人主张押《平水韵》,因为《平水韵》才是正宗的唐韵;另一部分人则主张押《中华新韵》,因为《中华新韵》符合时代的发展。此处,不做任何辩解,只简单说一下自己的观点,权当一家之言。……【阅读全文】

5月 09

哀民曲

中午吃饭的时候,看到一则短新闻:山东中部、南部降大到暴雨。
前一段时间听说山东大旱,猜想有可能会重复十年前的惨剧。十年前家乡连旱数年,小麦形如韭菜,颗粒无收。迫于生计,青壮年大多举家搬迁或出外打工,留守的基本上只有老弱妇孺了。说十室九空有些夸张,但荒芜的庭院、过膝的野草在村中却是处处可见。
已经两年没回家了,不知村中现在的境况如何,也许只会比预料的更糟。
希望旱情早日缓解,千万不要重复历史。
禁不住拿出2005年左右写的一首诗来,回顾一下历史,祈祷一下未来。……【阅读全文】

3月 21

山人何处君不见?东风一花倚阑干! ——《全唐诗》、《全宋词》统计分析报告

山人何处君不见?东风一花倚阑干!

——《全唐诗》、《全宋词》统计分析报告

一、源起

前两天看到了邱怡轩写的统计词话(一)。受其启发,决定利用自己的编程及统计分析能力,对《全唐诗》和《全宋词》进行一个较为全面的统计分析与比较。于是便有了你现在看到的这篇文章。
此处使用到的原始数据、程序脚本及结果图表等均可以在文末找到下载链接。

二、数据

《全唐诗》及《全宋词》的原始数据均来自于网络。
通过基本的编码转换以及“简单”的过滤筛选之后,就得到了用于后续统计分析的数据。

三、工具

系统平台:Linux(Ubuntu 10.10,AMD64)。
Shell命令行:转换编码(iconv)与换行符(fromdos)。
Perl(v5.10.1):用来过滤、筛选原始数据,得到可以用于后续分析的格式化数据。
R(v2.12.2):统计分析及图表绘制。
其他:Vim(v7.2.330),TimeForScience

四、结果

1.基本信息

general_info
补充:只考虑诗或词的主体内容的话,《全唐诗》共使用了7513种(个)汉字,而《全宋词》则使用了5750种(个)汉字。
此处的统计数据仅为约数,与其他的数据有一定的出入。主要原因在于原始数据的质量以及数据处理过程中的过滤筛选等。
相关的参考数据:
百度百科:《全唐诗》共收录唐代诗人2529人,诗作42863首。
玄烨为《全唐诗》所作的序中的说法:诗48900余首,2200余人。
日本学者平冈武夫的统计结果:《全唐诗》共收诗49403首,句1555条,作者2873人。
维基百科:《全宋词》收录宋代词人1330家,词作21116首。
Continue reading