이 문서는 Amazon Redshift에서 ClickHouse로 데이터 마이그레이션을 시작하기 위한 개요를 제공합니다.
소개
ClickHouse vs Redshift
- Redshift는 각 쿼리 실행 계획마다 코드를 컴파일합니다. 이로 인해 쿼리를 처음 실행할 때 상당한 오버헤드가 발생합니다. 이 오버헤드는 쿼리 패턴을 예측할 수 있고 컴파일된 실행 계획을 쿼리 캐시에 저장할 수 있을 때는 감수할 만합니다. 그러나 이는 쿼리가 가변적인 대화형 애플리케이션에서는 문제가 됩니다. Redshift가 이 코드 컴파일 캐시를 활용할 수 있는 경우에도 대부분의 쿼리에서는 ClickHouse가 더 빠릅니다. “ClickBench”를 참고하십시오.
- Redshift는 모든 큐에서 동시성을 50으로 제한합니다. 이는 BI에는 충분할 수 있지만 동시성이 매우 높은 분석 애플리케이션에는 적합하지 않습니다.
| Advantage | Description |
|---|---|
| 더 낮은 쿼리 지연 시간 | ClickHouse는 높은 동시성과 스트리밍 삽입이 있는 환경에서도 다양한 쿼리 패턴에 대해 더 낮은 쿼리 지연 시간을 제공합니다. 대화형 사용자 대상 분석에서는 캐시 미스가 불가피하지만, 그런 경우에도 ClickHouse는 쿼리를 빠르게 처리할 수 있습니다. |
| 더 높은 동시 쿼리 한도 | ClickHouse는 동시 쿼리에 대해 훨씬 더 높은 한도를 제공하며, 이는 실시간 애플리케이션 경험에 매우 중요합니다. ClickHouse에서는 자가 관리형이든 Cloud이든 각 서비스에 대해 애플리케이션에 필요한 동시성을 확보할 수 있도록 컴퓨트 할당을 확장할 수 있습니다. 허용되는 쿼리 동시성 수준은 ClickHouse에서 구성할 수 있으며, ClickHouse Cloud의 기본값은 1000입니다. |
| 더 뛰어난 데이터 압축 | ClickHouse는 더 뛰어난 데이터 압축을 제공하므로 전체 스토리지를 줄여 비용을 절감하거나, 같은 비용으로 더 많은 데이터를 저장하여 데이터에서 더 많은 실시간 인사이트를 얻을 수 있습니다. 아래의 “ClickHouse vs Redshift 스토리지 효율성”을 참고하십시오. |