各领域公开数据集下载
整理了一些网上的免费数据集,分类下载地址如下,希望节约大家找数据的时间。
1.经济金融
1.1.宏观经济
l 世界银行 World Development Indicators 数据
l Zillow 网站房地产价值预测竞赛数据【Kaggle竞赛】
l Sberbank 俄罗斯房地产价值预测竞赛数据【Kaggle竞赛】
1.2.金融市场
l 沪深股票除权除息、配股增发全量数据,截止 2016.12.31
l 上证主板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,1260支股票
l 深证主板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,466支股票
l 深证中小板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,852支股票
l 深证创业板日线数据,截止 2017.05.05,原始价、前复权价、后复权价,636支股票
l 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票
l 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票
l 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票
l 10 years of Dukascopy Forex Tick Data (2008-2019)
l Gas Prices in Brazil 巴西石油价格数据集
l Winton 股票回报率预测竞赛数据【Kaggle竞赛】
1.3.信用评估
l IBRD Statement Of Loans 贷款数据集
l Lending Club 网贷违约数据【Kaggle数据】
1.4.其它经济金融数据
2.交通出行
2.1.自动驾驶
2.2.共享出行数据
l T-Drive trajectory data sample【Kaggle竞赛】
l Shared Cars Locations 共享汽车位置数据集
l 芝加哥Divvy共享自行车骑行数据
2.3.其它交通出行数据
l 纽约出租车管理委员会官方的乘车数据(2009年-2016年)
l 运用卫星数据跟踪亚马逊热带雨林中的人类轨迹竞赛【Kaggle竞赛】
3.商业活动
l Amazon product co-purchasing 商品数据
l Bosch 生产流水线降低次品率竞赛数据【Kaggle竞赛】
l Airbnb 新用户的民宿预定预测竞赛数据【Kaggle竞赛】
l Grupo Bimbo 面包店库存和销量预测竞赛【Kaggle竞赛】
l 根据手机应有使用行为预测用户性别年龄竞赛【Kaggle竞赛】
4.推荐系统
l WikiLens
l Jester
l IMDB Large Movie Review Dataset 电影评论数据集
5.医疗健康
l Data Science Bowl 2017 肺癌识别数据
l COVID-19 image dataset collection (volumes folder) March 30th 2020
l Parkinson Classification 帕金森鉴别数据集
l EEG Brain Wave for Confusion 额叶波动的数据集
l Sunnybrook Cardiac Data – 2009 年心脏 MR 左心室分割挑战数据
l 细胞病理识别
l SPIE-AAPM-NCI PROSTATEx竞赛第1部分数据(MRI核磁共振影像识别前列腺癌程度数据)
l SPIE-AAPM-NCI PROSTATEx竞赛第2部分数据(MRI核磁共振影像识别前列腺癌程度数据)
l Indiana University - Chest X-Rays
l LNDb CT scan dataset (training)
l Ocular Disease Intelligent Recognition ODIR-5K
l The PatchCamelyon benchmark dataset (PCAM)
l object-CXR - Automatic detection of foreign objects on chest X-rays
l Breast Ultrasound Images Dataset (Dataset BUSI)
l My Complete Genome: 6k Base-Pairs of Phenotype SNPs – Complete Raw Data – DNA 遗传基因序列原始数据
l 从 CT 影像中对肺部影像进行分割并识别肺部容积【Kaggle竞赛】
l 通过Egg脑电图像预测患者癫痫病发作竞赛【Kaggle竞赛】
6.社会生活
l 世界大学排名
l LA Traffic Collision Data 洛杉矶交通事故数据集
l UW Madison Courses Grades UWM 课业情况数据
l Spanish Rail Tickets 西班牙高铁数据集
l Electric Motor Temperature 电机温度数据集
l Oakland Street Trees 奥克兰街道树木数据
l Women’s Shoes Prices 女性鞋类价格数据集
l 世界范围显著地震数据(1965-2016)【Kaagle数据】
l 美联航 Twitter 用户评论数据【Kaggle数据】
l 希拉里 vs 特朗普竞选期间 Twitter 数据【Kaggle竞赛】
l 美国连环凶案数据(1980-2014)【Kaggle竞赛】
7.三维重建
l CMU Monocular MoCap 单眼视图模型数据集
8.宇宙太空
l 115 paintings from the Hermitage museum, high-resolution, JPEG
l NASA Astronomy Picture of the Day Archive (7800 images, 2011)
l 2614 Images from Huble Space Telescope
l 350,000 Raw Images from Spirit and Opportunity Mars Rovers (with Metadata)
l 100 Images from Hubble Space Telescope
9.地理遥感
l Inria Aerial Image Labeling Dataset 遥感图像数据集
l UC Merced Land-Use Data Set 土地利用图像遥感数据集
l Inria Aerial Image Labeling 遥感数据集
10.科研和竞赛
l 台湾大学林智仁教授处理为 LibSVM 格式的分类建模数据
l Social Computing Data Repository 社交网络数据
l Microsoft Malware Classification Challenge
l 人体骨骼关键点检测竞赛数据【ChallengerAI 竞赛】
l 根据手机应用软件使用行为预测用户性别年龄竞赛数据【Kaggle竞赛】
11.拓扑图关系数据
11.1.社交网络
l Social Computing Data Repository 社交网络数据
l DBLP 数据集
11.2.知识图谱
l Sci-Hub SQL Database (2020-05-30)
11.3.其它图数据
12.图像数据
12.1.综合图像
l 微软 COCO 图像数据(2014年竞赛)
l Downsampled Open Images V4 Dataset
l PASCAL Visual Object Classes 2012 图像数据
l PASCAL Visual Object Classes 2011 图像数据
l PASCAL Visual Object Classes 2010 图像数据
l Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集
l COCO 2017 Resized to 256x256
12.2.人脸图像
l Labeled Faces in the Wild 人脸数据
l Extended Yale Face Database B 人脸数据
l FDDB_Face Detection Data Set and Benchmark
l NIST Mugshot Identification Database
l Caltech 10k Web Faces 人脸图像数据
l Caltech 10k Web Faces 面部图像数据集
l Vggface2: A dataset for recognising faces across pose and age
l Illinois DOC labeled faces dataset
l Deep Learning Face Attributes in the Wild
l Twitch Emotes Images Dataset
12.3.指纹识别
l NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据
l NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指纹识别数据
l NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指纹识别数据
12.4.物体分类图像
l Amazon Robotics Challenge 2017 Datasets
l Great Zebra and Giraffe Count ID Dataset
l 1000 Fundus images with 39 categories
l Cdiscount 商品图像分类竞赛【Kaggle竞赛】
12.5.Web标签图像
l Animals With Attributes 标签图像
12.6.视觉文字识别图像
l Street View House Number 门牌号图像数据
l MediaTeam Document 文档影印和内容数据
l NIST Handprinted Forms and Characters 手写英文字符数据
l NIST Structured Forms Reference Set of Binary Images (SFRS) 图像数据
l NIST Structured Forms Reference Set of Binary Images (SFRS) II 图像数据
12.7.特定一类事物图像
l Caltech-UCSD Birds200 鸟类图像数据
l Labeled Fishes in the Wild 鱼类图像
l Bald Classification Dataset 秃头头像数据集
l Nature Conservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle数据】
12.8.场景图像
l The Celebrity in Places 图像数据
12.9.目标检测
l Unsupervised Vehicle Appearance 车辆检测数据集
12.10.材质纹理图像
l ETHZ Synthesizability 纹理图像数据
12.11.姿态动作图像
l HMDB_a large human motion database
l Human Actions and Scenes Dataset
l Buffy Stickmen V3 人体轮廓识别图像数据
l Human Pose Evaluator 人体轮廓识别图像数据
l VGG Human Pose Estimation 姿势图像标注数据
l Biwi Kinect Head Pose 头部姿势数据
l LSP (Leeds Sports Pose) 人体姿态估计数据集
12.12.图像分割
l iMaterialist Fashion 服饰分割数据集
12.13.超分辨率图像
l Sun-Hays 80 Dataset 超分辨率图像数据集
l RIGA dataset (Retinal fundus images for glaucoma analysis)
l Kaggle Diabetic Retinopathy Detection Training Dataset
12.14.其它图像
l Visual Question Answering V1.0 图像数据
l Visual Question Answering V2.0 图像数据
l The Unsplash Lite Dataset 图片检索数据集精简版
13.视频数据
13.1.综合视频
l DAVIS_Densely Annotated Video Segmentation 数据
13.2.目标检测视频
13.3.姿态动作视频
l Microsoft Research Action 人类动作视频数据
l UCF50 Action Recognition 动作识别数据
l UCF101 Action Recognition 动作识别数据
l Recognition of human actions 动作视频数据
l SBU Kinect Interaction 肢体动作视频数据
l Kinetics400 Dataset: The Kinetics Human Action Video Dataset
l Kinetics700 Dataset: The Kinetics Human Action Video Dataset
13.4.密集人群检测视频
l Crowd Segmentation 高密度人群视频数据
l Tracking in High Density Crowds 高密度人群视频
13.5.其它视频
l Highway Traffic Videos 公路拥堵视频数据集
14.音频数据
14.1.综合音频
l Google Audioset 音频数据【数据太大仅有介绍】
14.2.语音识别
l Room Impulse Response and Noise 语音数据
14.3.音乐歌曲
l Million Song Dataset 百万流行乐数据集
15.自然语言处理
15.1.自然语言语料
l NIPS会议文章信息数据(1987-2016)【Kaggle数据】
l Stanford Sentiment Treebank 词汇数据
l 中文经典典籍语料
l 纽约时报新闻语料_New York Times 新闻语料
l Yelp reviews – Polarity 用户评论数据集
l Legal Case Reports DataSet 法律案件数据集
l Amazon Fine Food Reviews 食品评论数据集
l 1 Billion Word Language Model Benchmark R13 Output 基准语料库
l 希拉里 vs 特朗普竞选期间 Twitter 数据【Kaggle竞赛】
15.2.机器翻译
l European Parliament Proceedings Parallel Corpus 机器翻译数据
l WMT 2015 French/English parallel texts 法语/英语平行文本数据集
15.3.智能问答
l 30M Factoid Question-Answer Corpus
l The Children’s Book Test 问答数据集
l First Quora Release Question Pairs 问答数据
l Yale Youtube Vedio Text斯坦福问答数据【Kaggle数据】