메인 콘텐츠로 건너뛰기

개요

이 가이드는 ClickHouse Cloud의 프로덕션 배포를 위한 모니터링 및 관측성 기능에 대해 엔터프라이즈 팀이 알아야 할 정보를 제공합니다. 엔터프라이즈 고객은 기본 제공 모니터링 기능, Datadog 및 AWS CloudWatch 같은 도구를 포함한 기존 관측성 스택과의 통합, 그리고 ClickHouse의 모니터링이 자체 호스팅 배포와 비교해 어떤 차이가 있는지 자주 문의합니다. 사용자는 다음 방법으로 ClickHouse 배포를 모니터링할 수 있습니다.
SectionDescriptionWakes idle services?Setup required
Cloud Console 대시보드서비스 상태, 리소스 사용률, 쿼리 성능을 확인할 수 있는 기본 제공 대시보드를 사용한 일상적인 모니터링아니요없음
알림스케일링 이벤트, 오류, 뮤테이션, 청구에 대한 알림아니요없음(사용자 지정 가능)
Prometheus 엔드포인트메트릭을 Grafana, Datadog 또는 기타 Prometheus 호환 도구로 내보내기아니요API Key + scraper 구성
시스템 테이블 쿼리system 테이블에 직접 SQL 쿼리를 실행하여 심층 디버깅 및 사용자 지정 분석 수행SQL 쿼리
커뮤니티 및 파트너 통합Datadog agent 통합, 커뮤니티 모니터링 도구, Billing & Usage API상황에 따라 다름도구별
Advanced dashboard 참고문제 해결 예시를 포함한 각 Advanced dashboard 시각화의 상세 참고 자료아니요없음

빠른 시작

ClickHouse Cloud 콘솔을 열어 모니터링 탭으로 이동하십시오. 시작할 때 주의해야 할 일반적인 사항은 이 블로그에서 확인할 수 있습니다. 대부분의 사용자에게는 Cloud Console 대시보드만으로도 별도 구성 없이 서비스 상태, 리소스 사용률, 쿼리 성능을 모니터링하는 데 필요한 모든 기능이 제공됩니다. 외부 모니터링 스택과 통합해야 한다면 Prometheus 호환 메트릭 엔드포인트부터 시작하십시오.

시스템 영향 관련 고려 사항

위 접근 방식은 Prometheus 엔드포인트를 활용하거나, ClickHouse Cloud에서 관리하거나, 또는 시스템 테이블을 직접 쿼리하는 방법을 조합해 사용합니다. 이 가운데 마지막 옵션은 운영 중인 ClickHouse 서비스를 직접 쿼리하므로, 관찰 대상 시스템에 쿼리 부하를 추가하고 ClickHouse Cloud 인스턴스가 유휴 상태 전환되지 못하게 하여 비용에 영향을 줄 수 있습니다. 또한 운영 시스템에 장애가 발생하면 두 시스템이 서로 결합되어 있으므로 모니터링 역시 영향을 받을 수 있습니다. 시스템 테이블을 직접 쿼리하는 방식은 심층적인 내부 검사와 디버깅에는 효과적이지만, 실시간 운영 모니터링에는 덜 적합합니다. Cloud Console dashboardsPrometheus 엔드포인트는 모두 유휴 서비스를 깨우지 않는, 미리 스크레이프된 메트릭을 사용하므로 지속적인 운영 모니터링에 더 적합합니다. 상세한 시스템 분석 기능과 운영 오버헤드 사이의 이러한 절충점을 고려하십시오.
마지막 수정일 2026년 6월 10일