메인 콘텐츠로 건너뛰기
이 튜토리얼은 ClickHouse Cloud를 포함한 모든 ClickHouse 배포에서 사용할 수 있습니다.
ClickHouse를 시작하고 작동 방식을 익히는 데 도움이 되는 다양한 자료를 제공합니다:
  • ClickHouse를 설치하고 실행해야 한다면 Quick Start를 확인하십시오
  • ClickHouse 튜토리얼에서는 뉴욕시 택시 운행 데이터셋을 분석합니다
또한 샘플 데이터셋은 ClickHouse 사용 방법을 익히고, 중요한 기법과 요령을 배우며, ClickHouse의 강력한 다양한 함수를 활용하는 방법을 살펴보기에 매우 좋습니다. 샘플 데이터셋에는 다음이 포함됩니다:
페이지설명
Amazon 고객 리뷰Amazon 제품에 대한 고객 리뷰 1억 5천만 건 이상
AMPLab Big Data Benchmark데이터 웨어하우징 솔루션의 성능 비교에 사용되는 벤치마크 데이터셋
ClickHouse로 Stack Overflow 데이터 분석ClickHouse로 Stack Overflow 데이터 분석
익명화된 웹 분석hits와 visits를 포함한 익명화된 웹 분석 데이터로 이루어진 2개의 테이블로 구성된 데이터셋
Brown University 벤치마크기계 생성 로그 데이터를 위한 새로운 분석 벤치마크
COVID-19 공개 데이터COVID-19 Open-Data는 COVID-19 역학 데이터와 인구통계, 경제, 정부 대응과 같은 관련 요인을 포함하는 대규모 오픈소스 데이터베이스입니다
dbpedia 데이터셋Wikipedia의 문서 100만 건과 해당 벡터 임베딩을 포함한 데이터셋
환경 센서 데이터개방형 환경 데이터를 생성하는 기여자 중심의 글로벌 센서 네트워크인 Sensor.Community의 200억 건 이상의 데이터 레코드
Foursquare 장소 정보상점, 음식점, 공원, 놀이터, 기념물 등 지도상의 장소 정보를 담은 1억 건 이상의 레코드로 구성된 데이터셋입니다.
기지국 데이터셋을 활용한 Geo 데이터OpenCelliD 데이터를 ClickHouse에 로드하고, Apache Superset을 ClickHouse에 연결한 다음, 해당 데이터를 기반으로 dashboard를 구축하는 방법을 알아봅니다
GitHub 이벤트 데이터셋2011년부터 2020년 12월 6일까지 GitHub에서 발생한 모든 이벤트를 포함하는 데이터셋으로, 31억 개의 레코드로 구성됩니다.
Hacker News 데이터셋Hacker News 데이터 2,800만 행이 포함된 데이터셋입니다.
Hacker News 벡터 검색 데이터셋2,800만 개 이상의 Hacker News 게시물과 해당 벡터 임베딩이 포함된 데이터셋입니다.
LAION 5B 데이터셋LAION 5B 데이터셋의 1억 개 벡터를 포함한 데이터셋
Laion-400M 데이터셋영문 이미지 캡션이 포함된 4억 장의 이미지로 구성된 데이터셋
New York Public Library “What’s on the Menu?” 데이터셋호텔, 레스토랑, 카페의 메뉴와 각 요리의 가격에 관한 과거 데이터 130만 건이 포함된 데이터셋입니다.
뉴욕 택시 데이터2009년 이후 뉴욕시에서 출발한 택시 및 차량 호출 서비스(Uber, Lyft 등) 운행 데이터 수십억 건입니다.
NOAA Global Historical Climatology Network지난 120년간의 기후 데이터 25억 개의 행
NYPD 신고 데이터5단계로 Tab Separated Value 데이터를 수집하고 쿼리하기
OnTime항공편 정시 운항 성과를 담은 데이터셋
Star Schema Benchmark (SSB, 2009)Star Schema Benchmark (SSB) 데이터셋 및 쿼리
대만 과거 기상 데이터셋지난 128년간의 기상 관측 데이터 1억 3,100만 행
Criteo의 테라바이트 규모 클릭 로그Criteo의 클릭 로그 1테라바이트 분량
영국 부동산 가격 데이터셋잉글랜드와 웨일스의 부동산 거래 가격 데이터가 포함된 영국 부동산 데이터셋을 사용해 자주 실행하는 쿼리의 성능을 높이기 위해 프로젝션을 활용하는 방법을 알아보십시오
TPC-DS (2012)TPC-DS 벤치마크 데이터셋과 쿼리입니다.
TPC-H (1999)TPC-H 벤치마크 데이터셋과 쿼리입니다.
WikiStat5천억 개의 레코드를 포함한 WikiStat 데이터셋을 살펴봅니다.
GitHub 데이터를 사용해 ClickHouse에서 쿼리 작성하기ClickHouse 리포지토리의 모든 커밋과 변경 사항을 포함하는 데이터셋
YouTube 싫어요 데이터셋YouTube 동영상의 싫어요를 모아 놓은 데이터셋
마지막 수정일 2026년 6월 10일