我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版,欢迎购买。点击进入详情
GitHub严选:每天推荐一个GitHub优质开源项目
人生在勤,勤则不匮;户枢不蠹,流水不腐。
大家好,我是严选哥。
今天给大家带来的项目是:全网最全中华古诗词数据库
也许我们每天忙忙碌碌,却沉浸于英文字符和数字当中;也许我们每天刷着抖音,却不知道还有远方的诗词。生活再忙碌再累,也应该停下脚步,品味一下我们老祖先留下来的精神财产。
这里有最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。
为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。
古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过了一个星期。2017 年新加入全宋词,全宋词爬取过程及数据分析。
项目提供了完整的数据集:
数据集
-
全唐诗 json
-
全宋诗 json
-
全宋词 ci
-
五代·花间集 wudai/huajianji
-
五代·南唐二主词 wudai/nantan
-
论语 lunyu
-
诗经 shijing
-
幽梦影 youmengying
-
四书五经 sishuwujing
-
蒙學 mengxue
欢迎关注我的技术公众号:国民程序员,我们的目标:输出干货
- 每天分享原创技术文章
- 海量免费技术资料和视频学习资源
- 分享赚钱门道,带领程序员走向财务自由