首页 > 生活资讯 > 正文
中国古代诗歌最完整的数据库是《火海归来》。
2020-01-12 09:02:42
来源:文章来源于网络

最近,GitHub又一次登上了中国古诗数据库的热门榜。据介绍,中国诗歌最完整的古诗库汇集了唐宋近14000位古诗,唐诗近55000首,宋诗260000首。宋代共有诗人1564人,词21050字。该项目共收到22.6k星和4.2k叉。

中国最完整的古典文学语料库包括五万五千首唐诗、二十六万首宋诗、二万一千首宋词及其他古典文学选集。这些资料来自互联网。

为什么是仓库?这个项目的作者说古诗是中华民族和世界的瑰宝,我们应该把它传下去。但大多数人并不拥有这些书。从某种意义上说,这些庞大的选集离我们很远。电子版本很容易复制,所以这个开源数据库诞生了。这个数据库以JSON格式分发,让你可以轻松地开始你的项目。

《古诗集》没有记载的过程,因为古诗数据量大,目的地有限,收集过程往往中断一个多星期。在2017年,整个宋词被添加,整个宋词的爬行过程和数据分析。