3万+Star成就全网最全中华古诗词数据库

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情

GitHub严选:每天推荐一个GitHub优质开源项目

人生在勤,勤则不匮;户枢不蠹,流水不腐。

大家好,我是严选哥。

今天给大家带来的项目是:全网最全中华古诗词数据库

也许我们每天忙忙碌碌,却沉浸于英文字符和数字当中;也许我们每天刷着抖音,却不知道还有远方的诗词。生活再忙碌再累,也应该停下脚步,品味一下我们老祖先留下来的精神财产。

这里有最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。

为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。

古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过了一个星期。2017 年新加入全宋词,全宋词爬取过程及数据分析。
在这里插入图片描述
在这里插入图片描述

项目提供了完整的数据集:

数据集

  1. 全唐诗 json

  2. 全宋诗 json

  3. 全宋词 ci

  4. 五代·花间集 wudai/huajianji

  5. 五代·南唐二主词 wudai/nantan

  6. 论语 lunyu

  7. 诗经 shijing

  8. 幽梦影 youmengying

  9. 四书五经 sishuwujing

  10. 蒙學 mengxue

项目地址:
https://github.com/chinese-poetry/chinese-poetry

欢迎关注我的技术公众号:国民程序员,我们的目标:输出干货

  1. 每天分享原创技术文章
  2. 海量免费技术资料和视频学习资源
  3. 分享赚钱门道,带领程序员走向财务自由
图片名称

猜你喜欢

转载自blog.csdn.net/ddnosh/article/details/109898772