跳转到主要内容
为 Amazon S3 中的 Apache Hudi 表提供只读类表接口。

语法

hudi(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

参数

参数描述
url指向 S3 中现有 Hudi 表路径的存储桶 URL。
aws_access_key_id, aws_secret_access_keyAWS (https://aws.amazon.com/) 账户用户的长期凭证。你可以使用这些凭证对请求进行身份验证。这些参数是可选的。如果未指定凭证,则将使用 ClickHouse 配置中的凭证。更多信息,请参见 Using S3 for Data Storage
format文件的格式
structure表的结构。格式为 'column1_name column1_type, column2_name column2_type, ...'
compression该参数为可选项。支持的值:nonegzip/gzbrotli/brxz/LZMAzstd/zst。默认情况下,会根据文件扩展名自动检测压缩方式。
extra_credentials该参数为可选项。用于在 ClickHouse Cloud 中传递基于角色的访问所需的 role_arn。配置步骤请参见 Secure S3。更多信息请参见 Using S3 for Data Storage

返回值

一个具有指定结构的表,用于读取 S3 中指定 Hudi 表的数据。

虚拟列

  • _path — 文件路径。类型:LowCardinality(String)
  • _file — 文件名。类型:LowCardinality(String)
  • _size — 文件大小 (以字节为单位) 。类型:Nullable(UInt64)。如果文件大小未知,则值为 NULL
  • _time — 文件的最后修改时间。类型:Nullable(DateTime)。如果时间未知,则值为 NULL
  • _etag — 文件的 etag 值。类型:LowCardinality(String)。如果 etag 未知,则值为 NULL
最后修改于 2026年6月10日