| Amazon 고객 리뷰 | Amazon 제품에 대한 고객 리뷰 1억 5천만 건 이상 |
| AMPLab Big Data Benchmark | 데이터 웨어하우징 솔루션의 성능 비교에 사용되는 벤치마크 데이터셋 |
| ClickHouse로 Stack Overflow 데이터 분석 | ClickHouse로 Stack Overflow 데이터 분석 |
| 익명화된 웹 분석 | hits와 visits를 포함한 익명화된 웹 분석 데이터로 이루어진 2개의 테이블로 구성된 데이터셋 |
| Brown University 벤치마크 | 기계 생성 로그 데이터를 위한 새로운 분석 벤치마크 |
| COVID-19 공개 데이터 | COVID-19 Open-Data는 COVID-19 역학 데이터와 인구통계, 경제, 정부 대응과 같은 관련 요인을 포함하는 대규모 오픈소스 데이터베이스입니다 |
| dbpedia 데이터셋 | Wikipedia의 문서 100만 건과 해당 벡터 임베딩을 포함한 데이터셋 |
| 환경 센서 데이터 | 개방형 환경 데이터를 생성하는 기여자 중심의 글로벌 센서 네트워크인 Sensor.Community의 200억 건 이상의 데이터 레코드 |
| Foursquare 장소 정보 | 상점, 음식점, 공원, 놀이터, 기념물 등 지도상의 장소 정보를 담은 1억 건 이상의 레코드로 구성된 데이터셋입니다. |
| 기지국 데이터셋을 활용한 Geo 데이터 | OpenCelliD 데이터를 ClickHouse에 로드하고, Apache Superset을 ClickHouse에 연결한 다음, 해당 데이터를 기반으로 dashboard를 구축하는 방법을 알아봅니다 |
| GitHub 이벤트 데이터셋 | 2011년부터 2020년 12월 6일까지 GitHub에서 발생한 모든 이벤트를 포함하는 데이터셋으로, 31억 개의 레코드로 구성됩니다. |
| Hacker News 데이터셋 | Hacker News 데이터 2,800만 행이 포함된 데이터셋입니다. |
| Hacker News 벡터 검색 데이터셋 | 2,800만 개 이상의 Hacker News 게시물과 해당 벡터 임베딩이 포함된 데이터셋입니다. |
| LAION 5B 데이터셋 | LAION 5B 데이터셋의 1억 개 벡터를 포함한 데이터셋 |
| Laion-400M 데이터셋 | 영문 이미지 캡션이 포함된 4억 장의 이미지로 구성된 데이터셋 |
| New York Public Library “What’s on the Menu?” 데이터셋 | 호텔, 레스토랑, 카페의 메뉴와 각 요리의 가격에 관한 과거 데이터 130만 건이 포함된 데이터셋입니다. |
| 뉴욕 택시 데이터 | 2009년 이후 뉴욕시에서 출발한 택시 및 차량 호출 서비스(Uber, Lyft 등) 운행 데이터 수십억 건입니다. |
| NOAA Global Historical Climatology Network | 지난 120년간의 기후 데이터 25억 개의 행 |
| NYPD 신고 데이터 | 5단계로 Tab Separated Value 데이터를 수집하고 쿼리하기 |
| OnTime | 항공편 정시 운항 성과를 담은 데이터셋 |
| Star Schema Benchmark (SSB, 2009) | Star Schema Benchmark (SSB) 데이터셋 및 쿼리 |
| 대만 과거 기상 데이터셋 | 지난 128년간의 기상 관측 데이터 1억 3,100만 행 |
| Criteo의 테라바이트 규모 클릭 로그 | Criteo의 클릭 로그 1테라바이트 분량 |
| 영국 부동산 가격 데이터셋 | 잉글랜드와 웨일스의 부동산 거래 가격 데이터가 포함된 영국 부동산 데이터셋을 사용해 자주 실행하는 쿼리의 성능을 높이기 위해 프로젝션을 활용하는 방법을 알아보십시오 |
| TPC-DS (2012) | TPC-DS 벤치마크 데이터셋과 쿼리입니다. |
| TPC-H (1999) | TPC-H 벤치마크 데이터셋과 쿼리입니다. |
| WikiStat | 5천억 개의 레코드를 포함한 WikiStat 데이터셋을 살펴봅니다. |
| GitHub 데이터를 사용해 ClickHouse에서 쿼리 작성하기 | ClickHouse 리포지토리의 모든 커밋과 변경 사항을 포함하는 데이터셋 |
| YouTube 싫어요 데이터셋 | YouTube 동영상의 싫어요를 모아 놓은 데이터셋 |