메인 콘텐츠로 건너뛰기
이 함수는 hudi 테이블 함수의 확장 기능입니다. 지정된 클러스터의 여러 노드에서 Amazon S3의 Apache Hudi 테이블 파일을 병렬로 처리할 수 있습니다. initiator 노드에서는 클러스터의 모든 노드와 연결을 설정하고 각 파일을 동적으로 분배합니다. 워커 노드는 initiator 노드에 다음으로 처리할 작업을 요청해 처리합니다. 이 과정은 모든 작업이 완료될 때까지 반복됩니다.

구문

hudiCluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

인수

ArgumentDescription
cluster_name원격 서버와 로컬 서버의 주소 집합 및 연결 매개변수를 구성하는 데 사용되는 클러스터 이름입니다.
urlS3에 있는 기존 Hudi table의 경로가 포함된 버킷 url입니다.
aws_access_key_id, aws_secret_access_keyAWS 계정 사용자의 장기 자격 증명입니다. 이를 사용하여 요청을 인증할 수 있습니다. 이 매개변수는 선택 사항입니다. 자격 증명을 지정하지 않으면 ClickHouse 구성에 있는 자격 증명이 사용됩니다. 자세한 내용은 Using S3 for Data Storage를 참조하십시오.
format파일의 포맷입니다.
structuretable 구조입니다. 포맷은 'column1_name column1_type, column2_name column2_type, ...'입니다.
compression매개변수는 선택 사항입니다. 지원되는 값은 none, gzip/gz, brotli/br, xz/LZMA, zstd/zst입니다. 기본적으로 압축은 파일 확장자를 기준으로 자동 감지됩니다.
extra_credentials매개변수는 선택 사항입니다. ClickHouse Cloud에서 역할 기반 접근을 위한 role_arn을 전달하는 데 사용됩니다. 구성 단계는 Secure S3를 참조하십시오.

반환 값

S3의 지정된 Hudi 테이블에서 지정된 클러스터의 데이터를 읽기 위한, 지정된 구조(structure)의 테이블(table)입니다.

가상 컬럼

  • _path — 파일 경로. 유형: LowCardinality(String).
  • _file — 파일 이름. 유형: LowCardinality(String).
  • _size — 파일 크기(바이트). 유형: Nullable(UInt64). 파일 크기를 알 수 없으면 값은 NULL입니다.
  • _time — 파일의 마지막 수정 시각. 유형: Nullable(DateTime). 시각을 알 수 없으면 값은 NULL입니다.
  • _etag — 파일의 etag. 유형: LowCardinality(String). etag를 알 수 없으면 값은 NULL입니다.
마지막 수정일 2026년 6월 10일