uniqHLL12
実装の詳細
実装の詳細
この関数は、集約内のすべてのパラメータに対してハッシュを計算し、そのハッシュを使って計算を行います。
HyperLogLog アルゴリズムを使用して、引数の異なる値のおおよその個数を求めます。2^12 個の 5 ビットセルを使用します。
状態サイズは 2.5 KB をわずかに上回ります。
小規模なデータセット (<10K 要素) では、結果の精度はあまり高くなく、誤差は最大で約 10% です。
ただし、高カーディナリティのデータセット (10K-100M) では比較的正確で、最大誤差は約 1.6% です。
100M を超えると推定誤差は増加し、カーディナリティが極めて高いデータセット (1B+ 要素) では、この関数は非常に不正確な結果を返します。決定的な結果を返します (クエリ処理の順序に依存しません) 。
x— この関数は可変個の引数を受け取ります。Tuple(T)またはArray(T)またはDateまたはDateTimeまたはStringまたは(U)Int*またはFloat*またはDecimal
UInt64
例
基本的な使い方
Query
Response