唐朝诗人朋友圈

发布时间:2017-04-11 13:24:20

基于大数据技术的唐朝诗人朋友圈归纳系统需求分析

1背景

唐朝诗人之间存在着微妙的关系。比如杜甫非常喜欢李白,到了做梦都想见李白的地步:三夜频梦君,情亲见君意(《梦李白》)。而李白向孟浩然表过白:吾爱孟夫子,风流天下闻(《赠孟浩然》)。孟浩然的好基友则是王昌龄:数年同笔砚,兹夕间衾裯(《送王昌龄之岭南》)。

全唐诗一共四万多首,再加上诗人之间经常称呼对方的别称,整理起来非常麻烦。

2. 搜索诗人之间的引用关系

利用上面的诗人及别称列表,我们在全唐诗中来搜索诗人之间的引用关系。

规则是:诗的标题和正文中只要提到过对方,那么两者之间的引用关系加1。一首诗如果提到多次对方,只算一次引用。

经过计算机一番运转,最终得到了引用关系表。

2.1 李白和杜甫之间的引用关系

首先来检查一下李白和杜甫之间的引用关系:

不错,杜甫写了12首与李白有关的诗,李白则只有3首与杜甫有关的诗。李白这种朋友,确实差劲了一点啊……

从这张图也可以看出,我们的程序能够识别出诗人的别名,比如杜甫的《寄李十二白二十韵》和李白的《鲁郡东石门送杜二甫》都没有直接提到对方的名字。

2.2 引用关系排名

我给诗人之间的引用关系排了个座次,下面显示了排名前三十的引用关系:

我们看到,全唐诗中排名第一的好基友绝对是陆龟蒙和皮日休。这两位互相提到对方的次数都在百次以上,这是因为陆龟蒙和皮日休特别喜欢唱和,你写一首送我,我再回一首赠你,跟现在微博大V之间的互动差不多。这两位常年唱和,最后将往来的唱和诗作编写了中国文学史上的第一本唱和诗集:《松陵集》。为了不辜负他们之间的友谊,文学史上通常将两者合称为皮陆

从排名前三十的引用关系来看,白居易绝对是唐朝诗人朋友圈中的明星,是大V中的大V

3. 引用关系的可视化

只有引用关系列表岂不是有些干巴巴的,接下来才是本文的重头戏。我将使用ECharts来可视化诗人之间的引用关系,最终得到诗人们的社交网络。

3.1 全唐诗人社交网络图

因为一共有762位诗人,为了避免画出的图太拥挤,看不清,我只将前一百的引用关系图示化,如下图:

可能会看不清,请大家放大后再看。

图中:

箭头表示诗人们之间的引用关系。比如说白居易引用了元稹,那么就有白居易指向元稹的箭头,元稹引用了白居易,相应的也有元稹指向白居易的箭头。
 

箭头的粗细程度则表示了诗人们之间引用关系的强弱。白居易引用元稹的数量为167次,元稹引用白居易的数量为88次,那么白居易指向元稹的箭头就要粗一些。

 

图中清晰地显示除了唐朝诗人的两个大型朋友圈:杜甫-李白朋友圈、白居易朋友圈。没错,他们分别是盛唐和中唐两个时期的核心诗人。

虽然只画出了排名前一百的引用关系,但还是很拥挤。文学史上将唐诗根据时间划分为4个阶段:初唐、盛唐、中唐、晚唐。接下来我们就分别画出这四个阶段的社交网络图。

3.2 初唐诗人社交网络图

从箭头的粗细来看,初唐诗人中关系最好的是宋之问和沈铨期。这两位正是宫廷诗人的代表,他们两位确定了近体诗的格律,对仗等规则。粗略的说,近体诗的规则就是他们俩发明出来的。对了,他们俩在文学史上一般也合成沈宋哦,看来要成为好基友,没有文学史的认证是不行的。

3.3 盛唐诗人社交网络图

注:为了制图清晰,盛唐诗人社交网络只画出了引用数大于等于2的关系。

盛唐诗人的核心无疑是李杜文章在,光焰万丈长中提到的李白和杜甫了。我们再次看到,杜甫指向李白的箭头比李白指向杜甫的箭头要粗得多。而且盛唐的诗人们明显分为两群,一群以李白-杜甫为核心,一群以皇甫冉和刘长卿为核心,为什么有这样的局面?我也不知道,对文学史比较了解的朋友请在评论里赐教。

3.4 中唐诗人社交网络图

注:为了制图清晰,中唐诗人社交网络只画出了引用数大于等于2的关系。

中唐诗人社交网的特征很明显,各位诗人紧紧团结在以白居易、元稹、刘禹锡为核心的文坛政治局周围,勠力同心,同舟共济,为唐诗从浪漫主义向现实主义的伟大转折做出了历史性贡献。

3.5 晚唐诗人社交网络图

晚唐诗人的社交网络比较散乱,没有明显的核心。其中最重要的就是李商隐和杜牧了,他俩得到了文学史认证的小李杜好基友称号。

唐朝诗人朋友圈

相关推荐