整理了网上的公然数据集,分类下载以下,希望节俭大师的时候。 1.经济金融1.1.宏观经济l 美国劳工部统计局官方公布数据 l 天下银行 World Development Indicators 数据 l 天下列国经济成长数据 l 美国房地产公司 Zillow 公然美国房地产历史数据 l 几个宏观经济数据集 l 衡宇租赁信息查询次数猜测比赛【Kaggle比赛】 l Zillow 网站房地产代价猜测比赛数据【Kaggle比赛】 l Sberbank 俄罗斯房地产代价猜测比赛数据【Kaggle比赛】 1.2.金融市场l 沪深股票除权除息、配股增发全量数据,停止 2016.12.31 l 上证主板日线数据,停止 2017.05.05,原始价、前复权价、后复权价,1260支股票 l 深证主板日线数据,停止 2017.05.05,原始价、前复权价、后复权价,466支股票 l 深证中小板日线数据,停止 2017.05.05,原始价、前复权价、后复权价,852支股票 l 深证创业板日线数据,停止 2017.05.05,原始价、前复权价、后复权价,636支股票 l 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票 l 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票 l 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票 l MT4平台外汇买卖历史数据 l Forex平台外汇买卖历史数据 l 纽约股票买卖所标准普尔500股票数据 l 美国股票数据XBRL l 美国医疗保险市场数据 l 几组外汇买卖逐笔(Ticks)数据 l 10 years of Dukascopy Forex Tick Data (2008-2019) l Gas Prices in Brazil 巴西石油价格数据集 l 美国股票消息数据【Kaggle数据】 l 美国医疗保险市场数据【Kaggle数据】 l 美国金融客户赞扬数据【Kaggle数据】 l 美国股票数据XBRL【Kaggle数据】 l 纽约股票买卖所数据【Kaggle数据】 l Homesite 保险定价比赛数据【Kaggle比赛】 l Winton 股票回报率猜测比赛数据【Kaggle比赛】 1.3.信誉评价l IBRD Statement Of Loans 存款数据集 l Credit Card Fraud 信誉卡欺骗数据集 l Lending Club 网贷违约数据【Kaggle数据】 l 存款违约猜测比赛数据【Kaggle比赛】 l 信誉卡讹诈数据【Kaggle 数据】 1.4.别的经济金融数据l 银行产物保举比赛数据【Kaggle比赛】 l 猜测公寓租金比赛数据【Kaggle比赛】 2.交通出行2.1.自动驾驶l Udacity 自动驾驶数据集 l KITTI 自动驾驶数据 l Cityscapes 场景标注数据 l 德国交通标志识别数据 l 交通讯号识别视频数据 l CityStreet 城市街景数据集 l Comma.ai 自动驾驶视频数据集 l GOT-10k 方针跟踪数据集 l Streetview 街景数据集 l Dataset-UAV-123 视频数据集 l VOT2016 方针跟踪数据集 l OTB 方针追踪图像数据集 l SemanticKITTI 数据集 l Lyft Level 5 自动驾驶数据集 l Camvid 驾驶标签视频数据集 2.2.同享出行数据l Airbnb 开放数据 l Uber 纽约市搭车数据 l 波士顿 Airbnb 公然数据 l T-Drive trajectory data sample【Kaggle比赛】 l Shared Cars Locations 同享汽车位置数据集 l 芝加哥Divvy同享自行车骑行数据 l Capital 同享单车骑行数据 l Bay Area 同享单车骑行数据 l Nice Ride 同享单车骑行数据 l 美国查塔努加市同享单车骑行数据 l 花旗银行同享单车骑行数据 2.3.别的交通出行数据l 2013年纽约出租车行驶数据 l 2013年芝加哥出租车行驶数据 l 纽约出租车治理委员会官方的搭车数据(2009年-2016年) l 几小我类活动位置线路GPS数据集(骑行、跑步等) l 纽约 Uber 接客数据 【Kaggle数据】 l 英国车祸数据(2005-2015)【Kaagle数据】 l 芝加哥汽车超速数据【Kaggle数据】 l 纽约市出租车搭车时候猜测比赛数据【Kaggle比赛】 l 应用卫星数据跟踪亚马逊热带雨林中的人类轨迹比赛【Kaggle比赛】 3.贸易活动l Yelp 点评网站公然数据 l Amazon product co-purchasing 商品数据 l Open Payments Dataset l Enron Email 安然公司邮件数据 l 猜测公寓租金比赛数据 l 广告点击猜测比赛数据 l 餐厅营业支出猜测建模比赛 l 网站用户保举点击猜测比赛数据 l Amazon 食批批评数据【Kaggle数据】 l Amazon 无锁手机批评数据【Kaggle数据】 l 美国视频游戏销售和评价数据【Kaggle数据】 l Kaggle 各项比赛情况数据【Kaggle数据】 l Bosch 生产流水线下降次品率比赛数据【Kaggle比赛】 l 在线广告实时竞价数据【Kaggle数据】 l 购物车商品关联比赛数据【Kaggle比赛】 l Airbnb 新用户的民宿预定猜测比赛数据【Kaggle比赛】 l KKBOX 音乐用户续订猜测比赛【Kaggle比赛】 l Grupo Bimbo 面包店库存和销量猜测比赛【Kaggle比赛】 l Bosch 流水线下降次品率数据【Kaggle比赛】 l 按照手机应有益用行为猜测用户性别年龄比赛【Kaggle比赛】 4.保举系统l Netflix 电影评价数据 l MovieLens 20m 电影保举数据集 l MovieLens 100k 电影保举数据集 l WikiLens l Jester l HetRec2011 l Book Crossing l Large Movie Review l Retailrocket 商批批评和保举数据 l 1万本畅销书的6百万读者评分数据 l 用户保举点击猜测比赛数据【Kaggle比赛】 l Book-Crossing 图书评分数据集 l IMDB Large Movie Review Dataset 电影批评数据集 l Movie Plots 电影数据集 l Goodreads-Books 书籍数据集 5.医疗健康l Data Science Bowl 2017 肺癌识别数据 l COVID-19 image dataset collection (volumes folder) March 30th 2020 l Parkinson Classification 帕金森辨别数据集 l PDB 卵白质结构数据集(全球版) l EEG Brain Wave for Confusion 额叶波动的数据集 l Sunnybrook Cardiac Data – 2009 年心脏 MR 左心室朋分应战数据 l CaP前线腺癌数据集 l MURA 骨头X光数据集 l 人识别物体时大脑核磁共振影象数据 l 人了解单词时大脑核磁共振影象数据 l 心脏病心房图像及标注数据 l 细胞病理识别 l FIRE 视网膜眼底病变图像数据 l TCGA-LUAD 肺癌CT图像数据 l RIDER Lung CT 肺癌CT影象 l TCGA-COAD癌症CT影象数据 l TCIA-TCGA-OV 癌症CT影象数据 l TCIA RIDER NEURO 癌症MRI影象数据 l QIN Beast 乳腺癌MRI影象数据 l MIMIC-III 临床监护数据 l SPIE-AAPM-NCI PROSTATEx比赛第1部分数据(MRI核磁共振影象识别前线腺癌水平数据) l SPIE-AAPM-NCI PROSTATEx比赛第2部分数据(MRI核磁共振影象识别前线腺癌水平数据) l RIDER Breast 乳腺癌 MRI 影象数据 l Lung Phantom 癌症 CT 影象数据集 l TCIA-QIN-LUNG 肺癌 CT 影象数据集 l TCGA-ESCA癌症 CT 影象数据集 l TCGA-CESC癌症 CT 影象数据集 l TCGA-KICH癌症 CT 影象数据集 l Chest X-Ray Images l Indiana University - Chest X-Rays l LNDb CT scan dataset (training) l Ocular Disease Intelligent Recognition ODIR-5K l The PatchCamelyon benchmark dataset (PCAM) l object-CXR - Automatic detection of foreign objects on chest X-rays l Breast Ultrasound Images Dataset (Dataset BUSI) l My Complete Genome: 6k Base-Pairs of Phenotype SNPs – Complete Raw Data – DNA 遗传基因序列原始数据 l 食品营养成份数据 【Kaggle数据】 l EGG 大脑电波外形数据【Kaggle数据】 l 某人基因序列数据【Kaggle数据】 l 癌症CT影象数据【Kaggle数据】 l 软构造赘瘤CT图像数据【Kaggle数据】 l 医疗CT影象、年龄和对照标注数据【Kaggle比赛】 l 从 CT 影象中对肺部影象停止朋分并识别肺部容积【Kaggle比赛】 l 经过Egg脑电图像猜测患者癫痫病爆发比赛【Kaggle比赛】 l 遗传突变分类比赛【Kaggle比赛】 6.社会生活l 希拉里邮件门泄露邮件 l 天下大学排名 l 芝加哥市2001年以来犯罪记录数据 l 美国查塔努加市犯罪记录数据(2003年至今) l 芝加哥街边咖啡厅季节中的人行道咖啡厅答应数据 l 芝加哥餐馆卫生检查成果数据 l 几个城市气象交换站白天天气数据 l Reddit 2.5 百万交际消息数据 l Google的机群拜候数据 l MIT Saliency 眼睛阅读轨迹数据集 l Denver Police 丹佛市警局数据集 l LA Traffic Collision Data 洛杉矶交通变乱数据集 l UW Madison Courses Grades UWM 课业情况数据 l Waves Measuring 海浪丈量数据集 l Spanish Rail Tickets 西班牙高铁数据集 l Flights & Tickets 航班机票数据集 l Electric Motor Temperature 机电温度数据集 l Pizza Restaurants 披萨商铺数据集 l Oakland Street Trees 奥克兰街道树木数据 l Women’s Shoes Prices 女性鞋类价格数据集 l 天下范围明显地震数据(1965-2016)【Kaagle数据】 l 美国婴儿姓名数据【Kaagle数据】 l 全天下鲨鱼攻击人类数据【Kaagle数据】 l 1908年以来空难数据【Kaagle数据】 l 2016年美国总统大选数据【Kaagle数据】 l 2013年美国社区统计数据【Kaagle数据】 l 2014年美国社区统计数据【Kaagle数据】 l 2015年美国社区统计数据【Kaagle数据】 l 欧洲足球运带动赛事表示数据【Kaagle数据】 l 美国情况净化数据【Kaagle数据】 l 美国H1-B签证申请数据【Kaggle数据】 l IMDB五千部电影数据【Kaggle数据】 l 2015年航班耽搁和取消数据【Kaggle数据】 l 凶杀案报告数据【Kaggle数据】 l 人力资本分析数据【Kaggle数据】 l 美国费城犯罪数据【Kaggle数据】 l 历史棒球数据【Kaggle数据】 l 美联航 Twitter 用户批评数据【Kaggle数据】 l 希拉里 vs 特朗普竞选时代 Twitter 数据【Kaggle比赛】 l 美国连环凶案数据(1980-2014)【Kaggle比赛】 l 广告实时竞价数据【Kaggle比赛】 l 美国费城犯罪记录数据【Kaggle比赛】 l Reddit 用户交互记录【Kaggle比赛】 l 泰坦尼克灾难数据【Kaggle比赛】 l 消息和网页内容保举及点击比赛【Kaggle比赛】 l 科比布莱恩特投篮射中率数据【Kaggle比赛】 l 按照安检人体扫描成像猜测威胁比赛【Kaggle比赛】 7.三维重建l 3D DeskTop l CMU Monocular MoCap 单眼视图模子数据集 l 3D Object – 3D 模子数据集 l ModelNet 三维点云数据集 l Navona 图片数据集 l Piazza Bra 图片数据集 l Piazza Bra (NEW) 图片数据集 l 峨嵋山金顶寺 – 古修建图形数据集 l 武当山紫霄宫 – 古修建图像数据集 l 青城山上清宫 – 古修建图像数据集 l 五台山龙泉寺 – 古修建图像数据集 l 普陀山法雨寺 – 古修建图像数据集 l 九西岳旃檀寺 – 古修建图像数据集 l 清华大学老校门 – 三维重建数据集 l 清华书院 – 三维重建数据集 l 清华生命科学楼 – 三维重建数据集 8.宇宙太空l 115 paintings from the Hermitage museum, high-resolution, JPEG l NASA Astronomy Picture of the Day Archive (7800 images, 2011) l 2614 Images from Huble Space Telescope l 350,000 Raw Images from Spirit and Opportunity Mars Rovers (with Metadata) l 100 Images from Hubble Space Telescope 9.地理遥感l RSC11 遥感影象数据集 l AID 遥感影象数据集 l NWPU 遥感影象数据集 l Inria Aerial Image Labeling Dataset 遥感图像数据集 l UC Merced Land-Use Data Set 地盘操纵图像遥感数据集 l WHU-RS19遥感影象数据集 l SIRI-WHU遥感影象数据集 l UCAS-AOD 遥感影象数据集 l NWPU VHR-10 地理空间物体检测遥感数据集 l Inria Aerial Image Labeling 遥感数据集 l RSSCN7遥感图像数据集 10.科研和比赛l NIPS 2003 属性挑选比赛数据 l 台湾大学林智仁教授处置为 LibSVM 格式的分类建模数据 l Large-scale 分类建模数据 l 几个UCI 中 large-scale 分类建模数据 l Social Computing Data Repository 交际收集数据 l Kaggle比赛数据合辑(部分比赛数据) l UCI多分类组合出的二分类数据集 l UCI典范二分类数据集 l 机械视觉推理尝试数据 l BigMM 2015 比赛考证数据集 l KONECT 收集图结构和收集科学数据合辑 l Microsoft Malware Classification Challenge l 场景图像分类比赛数据【ChallengerAI 比赛】 l 人体骨骼关键点检测比赛数据【ChallengerAI 比赛】 l 图像中文表述比赛数据【ChallengerAI 比赛】 l 英文同声传译比赛数据【ChallengerAI 比赛】 l 中英文本翻译比赛数据【ChallengerAI 比赛】 l 虚拟股票趋向猜测【ChallengerAI 比赛数据】 l 猫和狗分类识别比赛数据【Kaggle比赛】 l DSTL 卫星图像识别比赛数据【Kaggle比赛】 l 按照手机利用软件利用行为猜测用户性别年龄比赛数据【Kaggle比赛】 l 人脸关键点标定比赛数据【Kaggle比赛】 11.拓扑图关系数据11.1.交际收集 l Social Computing Data Repository 交际收集数据 l DBLP 数据集 l 公然的大范围链接数据调集 11.2.常识图谱 l DBPedia Ontology 大型多域本体数据集 l 几个 RDFhdt 结构的图关系数据 l IMDB 电影数据仓库 l Sci-Hub SQL Database (2020-05-30) 11.3.别的图数据 l KONECT 收集图结构数据合集 12.图像数据12.1.综合图像l Visual Genome 图像数据 l Visual7w 图像数据 l 微软 COCO 图像数据(2014年比赛) l SUFR 图像数据 l ImageNet 2014 练习数据 l Tiny Images Dataset 图像数据集 l 80 Million Tiny Images l Downsampled Open Images V4 Dataset l PASCAL Visual Object Classes 2012 图像数据 l PASCAL Visual Object Classes 2011 图像数据 l PASCAL Visual Object Classes 2010 图像数据 l ImageNet 小尺寸图像数据集 l Yahoo Flickr 照片和视频数据集 l Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集 l PASCAL VOC DATASET l 微软COCO图像数据集 l COCO 2017 Resized to 256x256 l Tiny Images Dataset 12.2.人脸图像l IMDB-WIKI 500k+ 人脸图像、年龄性别数据 l Labeled Faces in the Wild 人脸数据 l Extended Yale Face Database B 人脸数据 l Bao Face 人脸数据 l DC-IGN 论文人脸数据 l 300 Face in Wild 图像数据 l BioID Face 人脸数据 l CMU Frontal Face Images l FDDB_Face Detection Data Set and Benchmark l NIST Mugshot Identification Database l Faces in the Wild 人脸数据 l CelebA 名流人脸图像数据 l VGG Face 人脸图像数据 l Caltech 10k Web Faces 人脸图像数据 l LS3D-W 人脸对齐 2D / 3D 数据集 l WIDER 人脸数据集 l IJB-B NIST 人脸数据集 l UDM Faces 人脸数据集 l UMD Faces 面部数据集 l IMDB-WIKI 人脸数据库 l PubFig 人脸数据集 l MUCT人脸数据库 l FDDB 面部地区数据集 l Caltech 10k Web Faces 面部图像数据集 l Vggface2: A dataset for recognising faces across pose and age l Illinois DOC labeled faces dataset l Deep Learning Face Attributes in the Wild l Twitch Emotes Images Dataset l CACD 跨年龄人脸识别和检索数据集 l CelebA 人脸属性数据集 l 人脸关键点标定比赛数据【Kaggle比赛】 12.3.指纹识别l NIST FIGS 指纹识别数据 l NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据 l NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指纹识别数据 l NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指纹识别数据 12.4.物体分类图像l COIL-20 图像数据 l COIL-100 图像数据 l Caltech-101 图像数据 l Caltech-256 图像数据 l CIFAR-10 图像数据 l CIFAR-100 图像数据 l STL-10 图像数据 l LabelMe_12_50k图像数据 l NORB v1.0 图像数据 l NEC Toy Animal 图像数据 l iCubWorld 图像分类数据 l Multi-class 图像分类数据 l GRAZ 图像分类数据 l PASCAL 3D+ 图像数据 l Amazon Robotics Challenge 2017 Datasets l T-LESS 无纹理工具检测和 6D 姿势估量数据集 l ITODD 产业 3D 物体检测数据集 l Great Zebra and Giraffe Count ID Dataset l 1000 Fundus images with 39 categories l Cdiscount 商品图像分类比赛【Kaggle比赛】 12.5.Web标签图像l HARRISON 交际标签图像 l NUS-WIDE 标签图像 l Visual Synset 标签图像 l Animals With Attributes 标签图像 12.6.视觉笔墨识别图像l Street View House Number 门商标图像数据 l MNIST 手写数字识别图像数据 l MediaTeam Document 文档影印和内容数据 l Text Recognition 笔墨图像数据 l NIST Handprinted Forms and Characters 手写英笔墨符数据 l NIST Structured Forms Reference Set of Binary Images (SFRS) 图像数据 l NIST Structured Forms Reference Set of Binary Images (SFRS) II 图像数据 l MLT 图片笔墨识别数据集 l 3D MNIST 数字识别图像数据【Kaggle数据】 12.7.特定一类事物图像l 著名的猫图像标注数据 l Caltech-UCSD Birds200 鸟类图像数据 l Stanford Car 汽车图像数据 l MIT Cars 汽车图像数据 l Stanford Cars 汽车图像数据 l Food-101 美食图像数据 l 17_Category_Flower 图像数据 l 102_Category_Flower 图像数据 l UCI Folio Leaf 图像数据 l Labeled Fishes in the Wild 鱼类图像 l 美国 Yelp 点评网站酒店照片 l CMU-Oxford Sculpture 塑像雕像图像 l Oxford-IIIT Pet 宠物图像数据 l Stanford Dogs Dataset 数据集 l 辛普森一家卡通形象图像【Kaggle比赛】 l Fashion-MNIST 时髦衣饰图像数据 l 分解的 3D 手势识别数据集 l Bald Classification Dataset 秃顶头像数据集 l TWDNE 二次元头像数据集 l Danbooru2018 动漫人物数据集 l Leaf counting 数据集 l xBD 自然灾难图像数据集 l MIT CBCL 身份判定数据库 l Nature Conservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle数据】 12.8.场景图像l Street Scences 图像数据 l Places2 场景图像数据 l UCF Google Street View 图像数据 l SUN 场景图像数据 l The Celebrity in Places 图像数据 l Places-Extra69 图像分类数据集 l Place365-Standard 图像分类数据集 l Flickr1024 图像场景数据集 l LSUN 大范围图像数据集 l ADE20K 场景剖析数据集 l SynthText 自然场景图像数据集 l 2014 Stereo 双目立体婚配数据集 12.9.方针检测l Stanford Drone Dataset l UCF-QNRF 大范围人群计数数据集 l VERI-Wild 监控图片数据集 l Unsupervised Vehicle APPearance 车辆检测数据集 l Vehicle ReId 车辆检测数据集 l Boats 船只影象数据集 l BoxCars21k 车辆检测数据集 l Reld HDR 低分辨率车牌数据集 l ROSV 交通摄像头图片数据集 l MVTec-AD 产业检测数据集 l BoxCars116k 车辆检测数据集 l CORe50 持续方针识别数据集 l NORB – 3D 物体图像识别数据集 l RSOD-Dataset 物体检测数据集 12.10.材质纹理图像l CURET 纹理材质图像数据 l ETHZ Synthesizability 纹理图像数据 l KTH-TIPS 纹理材质图像数据 l Describable Textures 纹理图像数据 12.11.姿势行动图像l HMDB_a large human motion database l Human Actions and Scenes Dataset l Buffy Stickmen V3 人体表面识别图像数据 l Human Pose Evaluator 人体表面识别图像数据 l Buffy pose 人类姿势图像数据 l VGG Human Pose Estimation 姿势图像标注数据 l MPII Human Shape人体表面数据 l Biwi Kinect Head Pose 头部姿势数据 l 上半身人像数据 INRIA Person 数据集 l HICO-DET 人物检测和行动识别数据集 l MADS 人体行动数据集 l MPII 人体姿势估量数据集 l LSP (Leeds Sports Pose) 人体姿势估量数据集 l FLIC 影视人体检测数据集 l MPII Human Pose Dataset l CMU Hand 手势数据集 12.12.图像朋分l BSDS500 表面检测与语义朋分数据集 l HICO 图像语义朋分数据集 l iMaterialist Fashion 衣饰朋分数据集 l HAKE-HICO 语义朋分数据集 l SBD 语义鸿沟数据集 12.13.超分辨率图像l Sun-Hays 80 Dataset 超分辨率图像数据集 l Set5,Set14 低复杂度单图像超分辨率数据集 l Urban100 超分辨率重建数据集 l RIGA dataset (Retinal fundus images for glaucoma analysis) l Kaggle Diabetic Retinopathy Detection Training Dataset 12.14.别的图像l Visual Question Answering V1.0 图像数据 l Visual Question Answering V2.0 图像数据 l MIT Saliency 眼睛阅读轨迹数据集 l The Unsplash Lite Dataset 图片检索数据集精简版 13.视频数据13.1.综合视频l DAVIS_Densely Annotated Video Segmentation 数据 13.2.方针检测视频l UCSD Pedestrian 行人视频数据 l Caltech Pedestrian 行人视频数据 l ETH 行人视频数据 l INRIA 行人视频数据 l TudBrussels 行人视频数据 l Daimler 行人视频数据 l ALOV++ 物体追踪视频数据 l 按照视频再次识他人身份的数据集 l 高速公路车辆视频数据 l NYU Depth V2 视频序列数据集 13.3.姿势行动视频l Microsoft Research Action 人类行动视频数据 l UCF50 Action Recognition 行动识别数据 l UCF101 Action Recognition 行动识别数据 l UT-Interaction 人类行动视频数据 l UCF iPhone 活动中传感器数据 l UCF YouTube 人类行动视频数据 l UCF Sport 人类行动视频数据 l UCF-ARG 人类行动视频数据 l HMDB 人类行动视频 l HOLLYWOOD2 人类行为行动视频数据 l Recognition of human actions 行动视频数据 l Motion Capture 行动捕捉视频数据 l SBU Kinect Interaction 肢体行动视频数据 l Daimler 行人视频数据 l Youtube face 人脸视频数据 l PoseTrack 多人视频姿势估量数据集 l PASCAL3D+ 3D 物体检测和姿势识别数据集 l Kinetics400 Dataset: The Kinetics Human Action Video Dataset l Kinetics700 Dataset: The Kinetics Human Action Video Dataset l UCSD Pedestrian 行人视频数据集 13.4.麋集人群检测视频l Crowd Counting 高密度人群图像 l Crowd Segmentation 高密度人群视频数据 l Tracking in High Density Crowds 高密度人群视频 13.5.别的视频l Fire Detection 视频数据 l YouTube 视频笔墨数据集 l Highway Traffic Videos 公路拥堵视频数据集 14.音频数据14.1.综合音频l Google Audioset 音频数据【数据太大唯一先容】 14.2.语音识别l Sinhala TTS 英语语音识别 l TIMIT 美式英语语音识别数据 l LibriSpeech ASR corpus 语音数据 l Room Impulse Response and Noise 语音数据 l ALFFA 非洲语音数据 l THUYG-20 维吾尔语语音数据 l AMI Corpus 语音识别 l Common Voice 中文语音数据集 l Common Voice 英文语音数据集 l THCHS30 中文语音数据集 l TIMIT 方言录音数据集 l TED-LIUM 英语语音识别练习语料库 14.3.音乐歌曲l Million Song 歌曲音频数据 l The Last.fm 广播音频数据 l MusicNet 数据集 l LMD-full MIDI 数据集 l Million Song Dataset 百万风行乐数据集 l Last.fm Dataset 歌曲数据集 15.自然说话处置15.1.自然说话语料l RCV1英语消息数据 l 20news 英语消息数据 l JRC Names列国说话专有实体称号 l Multi-Domain Sentiment V2.0 l LETOR 信息检索数据 l 美国假消息数据【Kaggle数据】 l NIPS会议文章信息数据(1987-2016)【Kaggle数据】 l 2016年美国总统选举辩说数据【Kaggle数据】 l WikiLinks 跨文档指代语料 l WikiText 英语语义词库数据 l Stanford Sentiment Treebank 辞汇数据 l 英语说话模子单词猜测比赛数据 l 中文典范典籍语料 l 几个网上收集的自然说话语料中文姓名语料 l 81万互联网辞汇词库 l Wikilinks 跨文档语料扩大版 l 几个聊天机械人语料 l TED 平行语料库 l Sogou 语料库 l 几个认知说话学数据 l 纽约时报消息语料_New York Times 消息语料 l 500万企业称号语料 l 某电商平台6万个商品数据 l NLPCC2016 消息数据集 l SogouCS 消息数据集 l THUCNews 消息数据集 l Jester 笑话评分数据集 l Amazon Reviews – Full 批评数据集 l Yelp reviews – Full 用户批评数据集 l Yelp reviews – Polarity 用户批评数据集 l AclImdb_v1 大型电影批评数据集 l BookCorpus 大型书籍文本数据集 l Legal Case Reports DataSet 法令案件数据集 l icwb2-data 中文分词数据集 l Amazon Fine Food Reviews 食批批评数据集 l Couplet-Dataset 对联数据集 l 1 Billion Word Language Model Benchmark R13 Output 基准语料库 l Sogou News 消息数据集 l AG News 消息文章数据集 l 希拉里 vs 特朗普竞选时代 Twitter 数据【Kaggle比赛】 l NIPS 2015年会群情文数据集【Kaggle比赛】 15.2.机械翻译l European Parliament Proceedings Parallel Corpus 机械翻译数据 l WMT 2011 News Crawl 机械翻译数据 l WMT 2015 French/English parallel texts 法语/英语平行文本数据集 l OpenMantra 漫画机械翻译评价数据集 15.3.智能问答l WikiAnswers 题目复述数据集 l Question-Answer 问答数据集 l 30M Factoid Question-Answer Corpus l The Children’s Book Test 问答数据集 l Yahoo! Answers 问答数据集 l CMU 实在问答对数据集 l Maluuba NewsQA 机械阅读了解数据集 l SQuAD 斯坦福问答数据集 l MSMARCO 机械阅读了解数据集 l First Quora Release Question Pairs 问答数据 l Yale Youtube Vedio Text斯坦福问答数据【Kaggle数据】 15.4.情感识别l 用户对美国航空公司的Twitter批评情感数据 l Sentiment Analysis 中文感情分析 |
整理了网上的公开数据集,分类下载如下,希望节约大家的时间。1.经济金融1.1.宏观经济
在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职
做数据可视化或者数据分析的朋友可能经常会碰到的问题就是有想法没有数据。想到我有几
Detectron2训练自己的实例分割数据集This article was original written by Jin Tian,
我们常常会遇到数据不足的情况。比如,你遇到的一个任务,目前只有小几百的数据,然而
如果有两名篮球手A和B,本来,无论是两分球还是三分球,A都要比B投得准,但是一个赛季
数据源:NUMBEO自从我的“randy77:数据看中国vs世界:2020年世界各国人均GDP最新排名
本文是《如何快速成为数据分析师》的第五篇教程,如果想要了解写作初衷,可以先行阅读
1.什么是数据库呢?每个人家里都会有冰箱,冰箱是用来干什么的?冰箱是用来存放食物的
本文是《如何快速成为数据分析师》的第六篇教程,如果想要了解写作初衷,可以先行阅读
近期成为月入两万的数据分析师的广告遍地都是,可能会对一些未入行的同学造成错觉。我
1. 你问不少同学加了微信,第一句往往类似这样: 在校或刚毕业的学生,没有实习经验,
我把每个函数的中文名都制作成了目录,通过目录能够快速定位到相应的函数。如果这篇文
写论文至关重要的一步就是查文献,为了让小伙伴们能够在查文献的路上少走弯路,顺利写
30个数据可视化工具(2020年更新)目录摘要• 零编程工具◦ 图表(9个)◦ 信息图(2
最近很多人私信询问如何看待出生人口或人口总量减少对征集兵员和国家安全的影响。这可
人类发展指数:Human Development Index(HDI),是联合国开发计划署从1990年开始发布
刚学习GIS和RS的同学肯定很困惑于数据的问题,因为没有数据,就没法分析,那么GIS最基
2022重磅数据公布,全年出生人口956万人,死亡人口1041万人。从性别构成来看,男性人
本文从数据中台的定义、核心能力、优点出发阐述企业数据中台建设的意义与必要性。一、
声明:本站内容由网友分享或转载自互联网公开发布的内容,如有侵权请反馈到邮箱 1415941@qq.com,我们会在3个工作日内删除,加急删除请添加站长微信:15924191378
Copyright @ 2022-2024 私域运营网 https://www.yunliebian.com/siyu/ Powered by Discuz! 浙ICP备19021937号-4