公共训练数据集网站

国内的公共训练数据集网站众多,为科研工作者、数据分析师、机器学习爱好者等提供了丰富的数据资源。以下是一些主要的国内公共训练数据集网站:

1、遇见数据集:国内的数据集搜索引擎,索引了国内外的大部分网站,提供来自全球的数据集,覆盖多个国家和地区,满足不同用户的国际数据需求。数据集涉及人脸识别、自动驾驶、图像识别等多个领域,满足不同行业和研究的需求。网址为www.selectdataset.com

2、阿里天池:阿里巴巴旗下的数据竞赛平台,提供了很多比赛数据集可以下载应用,同时也有众多开源数据可供日常模型训练使用。网址为https://tianchi.aliyun.com

3、Kaggle:虽然是一个国际性的数据挖掘线上竞赛平台,但提供了中文界面和丰富的数据集资源,用户可以通过竞赛提升算法及代码能力,同时也可以下载开源数据进行日常模型训练。网址中的数据集部分为https://www.kaggle.com/datasets

4、DataFountain:中国领先的数据科学竞赛平台,提供金融、交通、气象等多样化的数据集,专为中文用户设计,适合初学者和从业者。网址为https://www.datafountain.cn

5、和鲸社区:国内领先的数据科学与AI学习平台,支持在线编程和数据分析,提供多样化数据集,适合初学者和从业者。网址为https://www.heywhale.com

6、百度飞桨社区:百度提供的大量与AI相关的数据集平台,包括计算机视觉、NLP和深度学习等领域的数据集,适合中文用户。网址中的数据集部分为https://aistudio.baidu.com/datasetoverview/2/1

7、超神经:专注于行业AI数据集,提供医疗、零售、交通等领域的真实场景数据集,是开发者探索AI应用的优质选择。

8、国家统计局数据平台:中国官方数据统计平台,涵盖经济、社会、人口、环境等多种统计数据,适合从事社会科学研究的用户。网址为https://data.stats.gov.cn

9、DataCastle:提供开放数据集和竞赛服务,适合中文用户特别是教育领域研究者,拥有丰富竞赛与数据集资源。网址为https://www.datacastle.cn

10、北京高质量数据集服务平台:由北京市支持的权威数据集平台,提供中文场景优化的数据集,涵盖人工智能、自然语言处理等热门领域。网址为http://dataset.baiia.org.cn

此外,还有如中国统计信息网、搜数网、数据堂等平台也提供了丰富的数据集资源。这些平台不仅提供了数据集下载服务,还往往伴随着数据可视化、数据分析等工具和服务,为科研工作者和数据分析师提供了极大的便利。