メインコンテンツへスキップ
これは hudi テーブル関数の拡張です。 指定したクラスター内の多数のノードで、Amazon S3 上の Apache Hudi テーブルのファイルを並列処理できます。イニシエーターでは、クラスター内のすべてのノードへの接続を確立し、各ファイルを動的に振り分けます。ワーカーノードでは、次に処理するタスクをイニシエーターに問い合わせて処理します。これを、すべてのタスクが完了するまで繰り返します。

構文

hudiCluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

引数

ArgumentDescription
cluster_nameリモートおよびローカルのサーバーへのアドレスのセットと接続パラメーターの構築に使用されるクラスター名。
urlS3 内の既存の Hudi テーブルへのパスを含むバケット URL。
aws_access_key_id, aws_secret_access_keyAWS アカウントユーザーの長期的な認証情報です。これらを使用してリクエストを認証できます。これらのパラメーターは省略可能です。認証情報が指定されていない場合は、ClickHouse の設定にあるものが使用されます。詳細は Using S3 for Data Storage を参照してください。
formatファイルの フォーマット
structureテーブルの構造です。フォーマットは 'column1_name column1_type, column2_name column2_type, ...' です。
compressionこのパラメーターは省略可能です。サポートされている値: none, gzip/gz, brotli/br, xz/LZMA, zstd/zst。デフォルトでは、圧縮はファイル拡張子から自動検出されます。
extra_credentialsこのパラメーターは省略可能です。ClickHouse Cloud でロールベースアクセス用の role_arn を渡すために使用されます。設定手順については Secure S3 を参照してください。

戻り値

S3 上の指定した Hudi テーブル内のクラスターからデータを読み取るための、指定した構造を持つテーブルです。

仮想カラム

  • _path — ファイルへのパス。型: LowCardinality(String)
  • _file — ファイル名。型: LowCardinality(String)
  • _size — ファイルサイズ (バイト単位) 。型: Nullable(UInt64)。ファイルサイズが不明な場合、値は NULL です。
  • _time — ファイルの最終更新時刻。型: Nullable(DateTime)。時刻が不明な場合、値は NULL です。
  • _etag — ファイルの etag。型: LowCardinality(String)。etag が不明な場合、値は NULL です。
最終更新日 2026年6月10日