跳转到主要内容
这些教程适用于任何 ClickHouse 部署方式,包括 ClickHouse Cloud
我们提供了丰富的资源,帮助你快速上手并了解 ClickHouse 的工作原理: 此外,示例数据集还能带来很好的 ClickHouse 实践体验, 帮助你学习重要的技术和技巧,并了解如何充分利用 ClickHouse 的众多强大 函数。示例数据集包括:
页面说明
亚马逊客户评价超过 1.5 亿条亚马逊产品客户评价
AMPLab 大数据基准测试用于比较数据仓库解决方案性能的基准数据集。
使用 ClickHouse 分析 Stack Overflow 数据使用 ClickHouse 分析 Stack Overflow 数据
匿名化网站分析由两个表组成的数据集,包含匿名化的网站分析数据,分别为 hits 和 visits
布朗大学基准测试一项面向机器生成日志数据的新分析基准测试
COVID-19 开放数据COVID-19 Open-Data 是一个大型开源数据库,涵盖 COVID-19 流行病学数据以及人口统计、经济和政府应对等相关因素
DBpedia 数据集包含来自 Wikipedia 的 100 万篇文章及其嵌入向量的数据集
环境传感器数据来自 Sensor.Community 的逾 200 亿条数据记录。Sensor.Community 是一个由贡献者驱动、致力于创建开放环境数据的全球传感器网络。
Foursquare 地点数据包含超过 1 亿条记录的数据集,收录了地图上各类地点的信息,例如商店、餐厅、公园、游乐场和纪念碑。
使用基站数据集的 Geo 数据了解如何将 OpenCelliD 数据导入 ClickHouse、将 Apache Superset 连接到 ClickHouse,并基于这些数据构建仪表板
GitHub 事件数据集该数据集包含 2011 年至 2020 年 12 月 6 日期间 GitHub 上的所有事件,共计 31 亿条记录。
Hacker News dataset包含 2800 万行 Hacker News 数据的数据集。
Hacker News 向量搜索数据集包含 2800 多万个 Hacker News 帖子及其嵌入向量的数据集
LAION 5B 数据集包含 LAION 5B 数据集中 1 亿个向量的数据集
Laion-400M 数据集包含 4 亿张带英文图片说明的图像的数据集
纽约公共图书馆 “What’s on the Menu?” 数据集包含 130 万条历史记录的数据集,涵盖酒店、餐厅和咖啡馆菜单中的菜品及其价格。
纽约出租车数据自 2009 年以来始发于纽约市的数十亿条出租车和网约车 (Uber、Lyft 等) 行程数据
NOAA Global Historical Climatology Network过去 120 年的 25 亿行气候数据
NYPD 投诉数据只需 5 步即可摄取并查询制表符分隔值数据
OnTime包含航空公司航班准点率表现的数据集
星型 schema benchmark (SSB,2009) 星型 schema benchmark (SSB) 数据集和查询
台湾历史天气数据集过去 128 年的 1.31 亿行天气观测数据
来自 Criteo 的 TB 级点击日志来自 Criteo 的 1 TB 点击日志
英国房地产价格数据集了解如何使用投影来提升您经常运行的查询性能。该英国房地产数据集包含英格兰和威尔士的房地产成交价格数据
TPC-DS (2012)TPC-DS 基准测试的数据集和查询。
TPC-H (1999)TPC-H 基准测试的数据集和查询。
WikiStat探索包含 5000 亿条记录的 WikiStat 数据集。
使用 GitHub 数据在 ClickHouse 中编写查询语句包含 ClickHouse 仓库中所有提交和变更的数据集
YouTube 点踩数据集YouTube 视频点踩数据合集。
最后修改于 2026年6月10日