Saltar al contenido principal
Estos tutoriales funcionan con cualquier despliegue de ClickHouse, incluido ClickHouse Cloud.
Tenemos muchos recursos para ayudarte a empezar y aprender cómo funciona ClickHouse: Además, los conjuntos de datos de ejemplo son una excelente forma de trabajar con ClickHouse, aprender técnicas y trucos importantes, y ver cómo aprovechar las numerosas y potentes funciones de ClickHouse. Los conjuntos de datos de ejemplo incluyen:
PáginaDescripción
Reseñas de clientes de AmazonMás de 150 M de reseñas de clientes sobre productos de Amazon
AMPLab Big Data BenchmarkUn conjunto de datos de benchmark utilizado para comparar el rendimiento de soluciones de data warehousing.
Análisis de datos de Stack Overflow con ClickHouseAnálisis de datos de Stack Overflow con ClickHouse
Analítica web anonimizadaConjunto de datos compuesto por dos tablas que contienen datos anonimizados de analítica web con hits y visits
Benchmark de la Universidad BrownUn nuevo benchmark analítico para datos de logs generados por máquinas
Datos abiertos de la COVID-19COVID-19 Open-Data es una gran base de datos de código abierto de datos epidemiológicos sobre la COVID-19 y factores relacionados, como la demografía, la economía y las respuestas gubernamentales
conjunto de datos de DBpediaConjunto de datos que contiene 1 millón de artículos de Wikipedia y sus embeddings vectoriales
Datos de sensores medioambientalesMás de 20 mil millones de registros de datos de Sensor.Community, una red global de sensores impulsada por colaboradores que crea Datos Medioambientales Abiertos.
Lugares de FoursquareConjunto de datos de más de 100 millones de registros que contiene información sobre lugares en un mapa, como tiendas, restaurantes, parques, zonas de juegos infantiles y monumentos.
Datos geográficos a partir del conjunto de datos de torres de telefonía móvilAprende a cargar datos de OpenCelliD en ClickHouse, conectar Apache Superset a ClickHouse y crear un dashboard a partir de esos datos
Conjunto de datos de eventos de GitHubConjunto de datos que contiene todos los eventos de GitHub entre 2011 y el 6 de diciembre de 2020, con un total de 3.100 millones de registros.
Conjunto de datos de Hacker NewsConjunto de datos que contiene 28 millones de filas con datos de Hacker News.
Conjunto de datos de búsqueda vectorial de Hacker NewsConjunto de datos que contiene más de 28 millones de publicaciones de Hacker News y sus embeddings vectoriales
Conjunto de datos LAION 5BConjunto de datos con 100 millones de vectores del conjunto de datos LAION 5B
Conjunto de datos LAION-400MConjunto de datos con 400 millones de imágenes con pies de foto en inglés
Conjunto de datos “What’s on the Menu?” de la New York Public LibraryConjunto de datos que contiene 1,3 millones de registros históricos sobre los menús de hoteles, restaurantes y cafeterías, con los platos y sus precios.
Datos de taxis de Nueva YorkDatos de miles de millones de viajes en taxi y vehículos de transporte con conductor (Uber, Lyft, etc.) originados en la ciudad de Nueva York desde 2009
NOAA Global Historical Climatology Network2,5 mil millones de filas de datos climáticos de los últimos 120 años
Datos de denuncias del NYPDIngestar y consultar datos TSV en 5 pasos
OnTimeConjunto de datos que contiene información sobre la puntualidad de los vuelos de aerolíneas
Star Schema Benchmark (SSB, 2009)El conjunto de datos y las consultas de Star Schema Benchmark (SSB)
Conjuntos de datos meteorológicos históricos de Taiwán131 millones de filas de datos de observación meteorológica de los últimos 128 años
Un terabyte de registros de clics de CriteoUn terabyte de registros de clics de Criteo
El conjunto de datos de precios de inmuebles del Reino UnidoAprenda a usar proyecciones para mejorar el rendimiento de las consultas que ejecuta con frecuencia mediante el conjunto de datos de inmuebles del Reino Unido, que contiene datos sobre los precios pagados por inmuebles en Inglaterra y Gales
TPC-DS (2012)El conjunto de datos y las consultas del benchmark TPC-DS.
TPC-H (1999)El conjunto de datos y las consultas del benchmark TPC-H.
WikiStatExplora el conjunto de datos WikiStat, que contiene 500 mil millones de registros.
Escribir consultas en ClickHouse con datos de GitHubConjunto de datos que contiene todas las confirmaciones y los cambios del repositorio de ClickHouse
Conjunto de datos de reacciones “No me gusta” de YouTubeUna colección de reacciones “No me gusta” de videos de YouTube.
Última modificación el 10 de junio de 2026