Pular para o conteúdo principal
Esta é uma extensão da função de tabela deltaLake. Permite processar arquivos de tabelas Delta Lake no Amazon S3 em paralelo a partir de vários nós em um cluster especificado. No iniciador, cria uma conexão com todos os nós do cluster e distribui dinamicamente cada arquivo. No nó worker, solicita ao iniciador a próxima tarefa a ser processada e a processa. Isso se repete até que todas as tarefas sejam concluídas.

Sintaxe

deltaLakeCluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])
deltaLakeCluster(cluster_name, named_collection[, option=value [,..]])

deltaLakeS3Cluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])
deltaLakeS3Cluster(cluster_name, named_collection[, option=value [,..]])

deltaLakeAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])
deltaLakeAzureCluster(cluster_name, named_collection[, option=value [,..]])
deltaLakeS3Cluster é um alias de deltaLakeCluster; ambos são para o S3.

Argumentos

  • cluster_name — Nome de um cluster usado para montar um conjunto de endereços e parâmetros de conexão para servidores remotos e locais.
  • A descrição de todos os outros argumentos é igual à descrição dos argumentos na função de tabela deltaLake equivalente.
  • Um parâmetro opcional extra_credentials pode ser usado para passar um role_arn para controle de acesso baseado em função no ClickHouse Cloud. Consulte S3 seguro para ver as etapas de configuração.

Valor retornado

Uma tabela com a estrutura especificada para ler dados do cluster a partir da tabela Delta Lake especificada no S3.

Colunas virtuais

  • _path — Caminho do arquivo. Tipo: LowCardinality(String).
  • _file — Nome do arquivo. Tipo: LowCardinality(String).
  • _size — Tamanho do arquivo em bytes. Tipo: Nullable(UInt64). Se o tamanho do arquivo for desconhecido, o valor é NULL.
  • _time — Data e hora da última modificação do arquivo. Tipo: Nullable(DateTime). Se a data e hora forem desconhecidas, o valor é NULL.
  • _etag — O etag do arquivo. Tipo: LowCardinality(String). Se o etag for desconhecido, o valor é NULL.
Última modificação em 10 de junho de 2026