Sintaxe
- String de conexão
- URL da conta de armazenamento
- Coleção nomeada
As credenciais estão embutidas na string de conexão, portanto
account_name/account_key não são necessários separadamente:Argumentos
| Argumento | Descrição |
|---|---|
connection_string | Uma string de conexão que inclui credenciais embutidas (nome da conta + chave da conta ou SAS token). Ao usar esse formato, account_name e account_key não devem ser passados separadamente. Consulte Configurar uma string de conexão. |
storage_account_url | A URL do endpoint da conta de armazenamento, por exemplo, https://myaccount.blob.core.windows.net/. Ao usar esse formato, você deve também passar account_name e account_key. |
container_name | Nome do contêiner. |
blobpath | Caminho do arquivo. Oferece suporte aos seguintes caracteres curinga no modo somente leitura: *, **, ?, {abc,def} e {N..M}, em que N, M — números, 'abc', 'def' — strings. |
account_name | Nome da conta de armazenamento. Obrigatório ao usar storage_account_url sem SAS; não deve ser passado ao usar connection_string. |
account_key | Chave da conta de armazenamento. Obrigatória ao usar storage_account_url sem SAS; não deve ser passada ao usar connection_string. |
format | O formato do arquivo. |
compression | Valores compatíveis: none, gzip/gz, brotli/br, xz/LZMA, zstd/zst. Por padrão, a compressão será detectada automaticamente pela extensão do arquivo (o mesmo que definir como auto). |
structure | Estrutura da tabela. Formato: 'column1_name column1_type, column2_name column2_type, ...'. |
partition_strategy | Opcional. Valores compatíveis: WILDCARD ou HIVE. WILDCARD exige um {_partition_id} no caminho, que é substituído pela chave de partição. HIVE não permite caracteres curinga, pressupõe que o caminho é a raiz da tabela e gera diretórios particionados no estilo Hive com Snowflake IDs como nomes de arquivo e o formato do arquivo como extensão. O padrão é WILDCARD. |
partition_columns_in_data_file | Opcional. Usado apenas com a estratégia de partição HIVE. Informa ao ClickHouse se deve esperar que as colunas de partição sejam gravadas no arquivo de dados. O padrão é false. |
extra_credentials | Use client_id e tenant_id para autenticação. Se extra_credentials forem fornecidas, elas terão prioridade sobre account_name e account_key. |
Coleções nomeadas
| Chave | Obrigatório | Descrição |
|---|---|---|
container | Sim | Nome do contêiner. Corresponde ao argumento posicional container_name. |
blob_path | Sim | Caminho do arquivo (com wildcards opcionais). Corresponde ao argumento posicional blobpath. |
connection_string | Não* | String de conexão com credenciais embutidas. *É necessário fornecer connection_string ou storage_account_url. |
storage_account_url | Não* | URL do endpoint da conta de armazenamento. *É necessário fornecer connection_string ou storage_account_url. |
account_name | Não | Obrigatório ao usar storage_account_url |
account_key | Não | Obrigatório ao usar storage_account_url |
format | Não | Formato do arquivo. |
compression | Não | Tipo de compressão. |
structure | Não | Estrutura da tabela. |
client_id | Não | ID do cliente para autenticação. |
tenant_id | Não | ID do tenant para autenticação. |
Os nomes das chaves da coleção nomeada diferem dos nomes dos argumentos posicionais da função:
container (não container_name) e blob_path (não blobpath).Valor retornado
Exemplos
Leitura usando o formato storage_account_url
Leitura no formato connection_string
Gravação usando partições
Colunas virtuais
_path— Caminho do arquivo. Tipo:LowCardinality(String)._file— Nome do arquivo. Tipo:LowCardinality(String)._size— Tamanho do arquivo em bytes. Tipo:Nullable(UInt64). Se o tamanho do arquivo for desconhecido, o valor seráNULL._time— Horário da última modificação do arquivo. Tipo:Nullable(DateTime). Se o horário for desconhecido, o valor seráNULL.
Gravação particionada
Estratégia de particionamento
WILDCARD (padrão): substitui o curinga {_partition_id} no caminho do arquivo pela chave de particionamento real.
HIVE implementa o particionamento no estilo Hive para leituras & gravações. Gera arquivos usando o seguinte formato: <prefix>/<key1=val1/key2=val2...>/<snowflakeid>.<toLower(file_format)>.
Exemplo da estratégia de particionamento HIVE
configuração use_hive_partitioning
partition_strategy.
Quando a configuração use_hive_partitioning é definida como 1, o ClickHouse detecta o particionamento no estilo Hive no caminho (/name=value/) e permite usar colunas de partição como colunas virtuais na consulta. Essas colunas virtuais terão os mesmos nomes do caminho particionado.
Exemplo
Use a coluna virtual criada com particionamento no estilo Hive
azureBlobStorage oferece suporte a Shared Access Signatures (SAS).
Um Blob SAS token contém todas as informações necessárias para autenticar a solicitação, incluindo o blob de destino, as permissões e o período de validade. Para montar uma URL de blob, acrescente o SAS token ao endpoint do serviço Blob. Por exemplo, se o endpoint for https://clickhousedocstest.blob.core.windows.net/, a solicitação será: