雷军写的代码像诗一样优雅,我有最全中文诗歌古典文集数据库


大家好,我是可爱机灵的开源小妹!

最近公众号改版了,大家记得星标开源小分队,第一时间收到我们优质内容的更新!

诗词是心灵的绽放,映照每一回寒来暑往,它是”草长莺飞二月天“,它是”稻花香里说丰年“,我们走过春夏秋冬,诗意始终伴随左右。

《中国诗词大会》唯美开场词:

千门万户曈曈日,总把新桃换旧符。

我见青山多妩媚,料青山见我应如是。

律回岁晚冰霜少,春到人间草木知。

读书不觉已春深,一寸光阴一寸金。

杨柳青青江水平,闻郎江上唱歌声。

慈母手中线,游子身上衣。

身无彩凤双飞翼,心有灵犀一点通。

长风破浪会有时,直挂云帆济沧海。

天地英雄气,千秋尚凛然。

安得广厦千万间,大庇天下寒士俱欢颜。

上学的时候,大家可能都有背诗的经历,或许也是曾经的噩梦。古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,今天小妹在逛 GitHub 时候,发现一个很棒的项目 chinese-poetry,最全中文诗歌古典文集数据库。

简介

Chinese-poetry 可能是全网最全中文是个古典文集数据库了,数据是 json 格式,方便进行版本管理。该项目截止目前为止收集了互联网上 5.5 万首唐诗、26 万首宋诗和2.1 万首宋词。唐宋两朝近 1.4 万古诗人, 和两宋时期 1.5K 词人。

数据集

该仓库收集的数据集合如下:

  • 全唐诗 json
  • 全宋诗 json
  • 全宋词 ci
  • 五代·花间集 wudai
  • 五代·南唐二主词 wudai
  • 论语 lunyu
  • 诗经 shijing
  • 幽梦影 youmengying
  • 四书五经 sishuwujing
  • 蒙學 mengxue

古诗JSON结构

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
[
{
"strains": [
"平平平仄仄,平仄仄平平。",
"仄仄平平仄,平平仄仄平。",
"平平平仄仄,平仄仄平平。",
"平仄仄平仄,平平仄仄平。"
],
"author": "太宗皇帝",
"paragraphs": [
"秦川雄帝宅,函谷壯皇居。",
"綺殿千尋起,離宮百雉餘。",
"連甍遙接漢,飛觀迥凌虛。",
"雲日隱層闕,風煙出綺疎。"
],
"title": "帝京篇十首 一"
},
... 每单个JSON文件1000条唐诗记录.
]

高频词分析图

  • 宋词受欢迎的词牌名

  • 唐诗高频词

  • 宋词作者作品榜

  • 唐诗作者作品榜

小结

唐诗宋词是我们老祖宗留给我们的文学精华。古人以诗词作为载体,来阐述自己内心的离别之情,思乡怀仁之情,国破家亡,怀才不遇等。

我们也引用那些经典唐诗宋词中的名句来表达自己的情感,而不是使用一些皱巴巴的辞藻。

通过小妹的安利,大家是不是也想加入到文艺青年的队伍,在公众号后台回复【诗词】,获取项目地址吧~~~

写在最后

欢迎加入开源小分队读者交流群,聊天学习摸鱼为主,不定时会分享一些技术要点和优质学习资源,有一群有趣有料的小伙伴在等你哦!

进群方式:开源小分队 公众号后台回复888,按提示操作即可进群。

问君能有几多愁,开源项目解千愁,我们下期再见!

大家的点赞、收藏和评论对小妹非常重要,如文章对你有帮助还请转发支持下,谢谢!


文章作者: 开源小分队
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 开源小分队 !
  目录