ClickPipes를 통해 MongoDB에서 ClickHouse Cloud로 데이터를 수집하는 기능은 현재 공개 베타입니다.
ClickHouse Cloud 콘솔과 문서에서는 MongoDB의 “table”과 “collection”을 같은 의미로 혼용합니다.
사전 요구사항
ClickPipe 만들기
- ClickHouse Cloud 콘솔에서 ClickHouse Cloud 서비스로 이동합니다.
- 왼쪽 메뉴에서
Data Sources버튼을 선택한 다음 “Set up a ClickPipe”를 클릭합니다.
MongoDB CDC타일을 선택합니다.
원본 MongoDB 데이터베이스 연결 추가
- 사전 준비 단계에서 구성한 원본 MongoDB 데이터베이스의 연결 정보를 입력합니다.
연결 정보를 추가하기 전에 방화벽 규칙에서 ClickPipes IP 주소를 허용했는지 확인하십시오. 다음 페이지에서 ClickPipes IP 주소 목록을 확인할 수 있습니다.
자세한 내용은 이 페이지 상단에 링크된 소스 MongoDB 설정 가이드를 참조하십시오.
(선택 사항) SSH 터널링 설정
- “Use SSH Tunnelling” 토글을 활성화합니다.
- SSH 연결 정보를 입력합니다.
-
키 기반 인증을 사용하려면 “Revoke and generate key pair”를 클릭하여 새 키 쌍을 생성한 다음, 생성된 공개 키를 SSH 서버의
~/.ssh/authorized_keys에 복사합니다. - “Verify Connection”을 클릭하여 연결을 확인합니다.
ClickPipes가 SSH 터널을 설정할 수 있도록 SSH 배스천 호스트의 방화벽 규칙에서 ClickPipes IP 주소를 허용해야 합니다.
다음을 클릭합니다.
고급 설정 구성
- Sync interval: ClickPipes가 원본 데이터베이스의 변경 사항을 폴링하는 간격입니다. 이 값은 대상 ClickHouse 서비스의 비용에 영향을 줄 수 있으므로, 비용에 민감한 경우에는 값을 더 크게(
3600초과) 유지하는 것이 좋습니다. - Pull batch size: 단일 배치에서 가져올 행 수입니다. 이는 가능한 한 반영되는 설정이며, 모든 경우에 항상 적용되지는 않을 수 있습니다.
- Snapshot number of tables in parallel: 초기 스냅샷 중 병렬로 가져올 테이블 수입니다. 테이블 수가 많은 경우, 병렬로 가져오는 테이블 수를 제어하는 데 유용합니다.
테이블 구성
- 여기에서 ClickPipe의 대상 데이터베이스를 선택할 수 있습니다. 기존 데이터베이스를 선택하거나 새로 만들 수 있습니다.
- 소스 MongoDB 데이터베이스에서 복제할 테이블을 선택할 수 있습니다. 테이블을 선택할 때 대상 ClickHouse 데이터베이스에서 테이블 이름을 변경할 수도 있습니다.
권한을 검토하고 ClickPipe를 시작합니다
- 권한 드롭다운에서 “Full access” Role을 선택한 다음 “Complete Setup”을 클릭합니다.
다음 단계는?
주의사항
- MongoDB 버전 5.1.0+가 필요합니다.
- CDC를 위해 MongoDB의 네이티브 Change Streams API를 사용하며, 이는 MongoDB oplog를 기반으로 실시간 변경 사항을 캡처합니다.
- MongoDB의 문서는 기본적으로 ClickHouse에 JSON 타입으로 복제됩니다. 이를 통해 스키마를 유연하게 관리할 수 있으며, ClickHouse의 다양한 JSON 연산자를 사용해 쿼리와 분석을 수행할 수 있습니다. JSON 데이터 쿼리에 대한 자세한 내용은 여기에서 확인할 수 있습니다.
- 현재 셀프서비스 PrivateLink 구성은 지원되지 않습니다. AWS를 사용 중이고 PrivateLink가 필요하면 db-integrations-support@clickhouse.com으로 문의하거나 지원 티켓을 생성해 주십시오. 활성화할 수 있도록 지원해 드리겠습니다.