진정한 컬럼 지향 데이터베이스 관리 시스템
데이터 압축
데이터의 디스크 저장
여러 코어에서 병렬 처리
여러 서버에서의 분산 처리
SQL 지원
벡터 연산 엔진
실시간 데이터 삽입
데이터를 프라이머리 키(primary key) 기준으로 물리적으로 정렬하면 특정 값이나 값 범위를 기준으로 수십 밀리초도 채 걸리지 않는 낮은 지연 시간으로 데이터를 추출할 수 있습니다.
보조 인덱스
온라인 쿼리에 적합
근사 계산 지원
- 고유값 개수, 중앙값, 분위수를 근사 계산하는 집계 함수
- 데이터의 일부(SAMPLE)를 기반으로 쿼리를 실행해 근사 결과를 얻는 방법입니다. 이 경우 디스크에서 읽어오는 데이터 양도 비례해 줄어듭니다.
- 모든 키가 아니라 제한된 수의 무작위 키에 대해서만 집계를 실행하는 방법입니다. 데이터의 키 분포가 특정 조건을 만족하면 더 적은 리소스로도 충분히 정확한 결과를 얻을 수 있습니다.
적응형 조인 알고리즘
데이터 복제 및 데이터 무결성 지원
역할 기반 접근 제어
단점으로 볼 수 있는 기능
- 완전한 트랜잭션을 지원하지 않습니다.
- 이미 삽입된 데이터를 높은 처리량과 낮은 지연 시간으로 수정하거나 삭제하는 데 한계가 있습니다. 다만 데이터를 정리하거나 수정하기 위한 일괄 삭제 및 업데이트는 지원하며, 예를 들어 GDPR 준수에 사용할 수 있습니다.
- 희소 인덱스 때문에 키로 단일 행을 조회하는 포인트 쿼리에서는 ClickHouse의 효율이 다소 떨어집니다.