- 如果你需要安装并运行 ClickHouse,请查看我们的快速入门
- ClickHouse 教程会分析纽约市出租车行程数据集
| 页面 | 说明 |
|---|---|
| 亚马逊客户评价 | 超过 1.5 亿条亚马逊产品客户评价 |
| AMPLab 大数据基准测试 | 用于比较数据仓库解决方案性能的基准数据集。 |
| 使用 ClickHouse 分析 Stack Overflow 数据 | 使用 ClickHouse 分析 Stack Overflow 数据 |
| 匿名化网站分析 | 由两个表组成的数据集,包含匿名化的网站分析数据,分别为 hits 和 visits |
| 布朗大学基准测试 | 一项面向机器生成日志数据的新分析基准测试 |
| COVID-19 开放数据 | COVID-19 Open-Data 是一个大型开源数据库,涵盖 COVID-19 流行病学数据以及人口统计、经济和政府应对等相关因素 |
| DBpedia 数据集 | 包含来自 Wikipedia 的 100 万篇文章及其嵌入向量的数据集 |
| 环境传感器数据 | 来自 Sensor.Community 的逾 200 亿条数据记录。Sensor.Community 是一个由贡献者驱动、致力于创建开放环境数据的全球传感器网络。 |
| Foursquare 地点数据 | 包含超过 1 亿条记录的数据集,收录了地图上各类地点的信息,例如商店、餐厅、公园、游乐场和纪念碑。 |
| 使用基站数据集的 Geo 数据 | 了解如何将 OpenCelliD 数据导入 ClickHouse、将 Apache Superset 连接到 ClickHouse,并基于这些数据构建仪表板 |
| GitHub 事件数据集 | 该数据集包含 2011 年至 2020 年 12 月 6 日期间 GitHub 上的所有事件,共计 31 亿条记录。 |
| Hacker News dataset | 包含 2800 万行 Hacker News 数据的数据集。 |
| Hacker News 向量搜索数据集 | 包含 2800 多万个 Hacker News 帖子及其嵌入向量的数据集 |
| LAION 5B 数据集 | 包含 LAION 5B 数据集中 1 亿个向量的数据集 |
| Laion-400M 数据集 | 包含 4 亿张带英文图片说明的图像的数据集 |
| 纽约公共图书馆 “What’s on the Menu?” 数据集 | 包含 130 万条历史记录的数据集,涵盖酒店、餐厅和咖啡馆菜单中的菜品及其价格。 |
| 纽约出租车数据 | 自 2009 年以来始发于纽约市的数十亿条出租车和网约车 (Uber、Lyft 等) 行程数据 |
| NOAA Global Historical Climatology Network | 过去 120 年的 25 亿行气候数据 |
| NYPD 投诉数据 | 只需 5 步即可摄取并查询制表符分隔值数据 |
| OnTime | 包含航空公司航班准点率表现的数据集 |
| 星型 schema benchmark (SSB,2009) | 星型 schema benchmark (SSB) 数据集和查询 |
| 台湾历史天气数据集 | 过去 128 年的 1.31 亿行天气观测数据 |
| 来自 Criteo 的 TB 级点击日志 | 来自 Criteo 的 1 TB 点击日志 |
| 英国房地产价格数据集 | 了解如何使用投影来提升您经常运行的查询性能。该英国房地产数据集包含英格兰和威尔士的房地产成交价格数据 |
| TPC-DS (2012) | TPC-DS 基准测试的数据集和查询。 |
| TPC-H (1999) | TPC-H 基准测试的数据集和查询。 |
| WikiStat | 探索包含 5000 亿条记录的 WikiStat 数据集。 |
| 使用 GitHub 数据在 ClickHouse 中编写查询语句 | 包含 ClickHouse 仓库中所有提交和变更的数据集 |
| YouTube 点踩数据集 | YouTube 视频点踩数据合集。 |