メインコンテンツへスキップ

approx_top_k

導入バージョン: v1.1.0 指定されたカラム内で、おおよそ出現頻度が最も高い値とその出現回数の配列を返します。 返される配列は、値そのものではなく、値のおおよその出現頻度の高い順にソートされます。 この関数は、結果を保証するものではありません。 状況によってはエラーが発生し、最頻値ではない頻出値が返されることがあります。 構文
approx_top_k(N[, reserved])(column)
別名: approx_top_count パラメータ
  • N — 返す要素数。デフォルト値: 10N の最大値は 65536UInt64
  • reserved — オプション。値の格納用に予約するセル数を指定します。uniq(column) > reserved の場合、結果は近似になります。デフォルト値: N * 3UInt64
引数
  • column — 最も頻出する値を求める対象のカラム名。String
戻り値 近似的に最も頻出する値とその出現回数を、概算の出現頻度の高い順に並べた配列を返します。Array 使用例
Query
SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘
関連項目
最終更新日 2026年6月10日