메인 콘텐츠로 건너뛰기
이는 iceberg 테이블 함수의 확장입니다. 지정된 클러스터의 여러 노드에서 Apache Iceberg 파일을 병렬로 처리할 수 있습니다. initiator에서는 클러스터의 모든 노드에 연결을 생성하고 각 파일을 동적으로 분배합니다. worker 노드에서는 initiator에 다음으로 처리할 작업을 요청한 뒤 이를 처리합니다. 이 과정은 모든 작업이 완료될 때까지 반복됩니다.

구문

icebergS3Cluster(cluster_name, url [, NOSIGN | access_key_id, secret_access_key, [session_token]] [,format] [,compression_method] [,extra_credentials])
icebergS3Cluster(cluster_name, named_collection[, option=value [,..]])

icebergAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
icebergAzureCluster(cluster_name, named_collection[, option=value [,..]])

icebergHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])
icebergHDFSCluster(cluster_name, named_collection[, option=value [,..]])

인수

  • cluster_name — 원격 및 로컬 서버에 대한 주소 집합과 연결 매개변수를 구성하는 데 사용되는 클러스터 이름입니다.
  • 나머지 모든 인수에 대한 설명은 동등한 iceberg 테이블 함수의 인수 설명과 동일합니다.
  • 선택적 extra_credentials 매개변수는 ClickHouse Cloud에서 역할 기반 접근을 위한 role_arn을 전달하는 데 사용할 수 있습니다. 구성 단계는 Secure S3를 참조하십시오.
반환 값 지정된 Iceberg 테이블에서 지정된 클러스터의 데이터를 읽기 위한, 지정된 구조의 테이블입니다. 예시
SELECT * FROM icebergS3Cluster('cluster_simple', 'http://test.s3.amazonaws.com/clickhouse-bucket/test_table', 'test', 'test')

가상 컬럼

  • _path — 파일 경로입니다. 유형: LowCardinality(String).
  • _file — 파일 이름입니다. 유형: LowCardinality(String).
  • _size — 바이트 단위의 파일 크기입니다. 유형: Nullable(UInt64). 파일 크기를 알 수 없으면 값은 NULL입니다.
  • _time — 파일이 마지막으로 수정된 시간입니다. 유형: Nullable(DateTime). 시간을 알 수 없으면 값은 NULL입니다.
  • _etag — 파일의 etag 값입니다. 유형: LowCardinality(String). etag를 알 수 없으면 값은 NULL입니다.
관련 항목
마지막 수정일 2026년 6월 10일