Introduzido em: v1.1.0
Retorna um array com os valores aproximadamente mais frequentes e suas contagens na coluna especificada.
O array resultante é ordenado em ordem decrescente pela frequência aproximada dos valores (e não pelos próprios valores).
Além disso, o peso de cada valor é levado em conta.
Esta função não garante um resultado.
Em determinadas situações, podem ocorrer erros, e ela pode retornar valores frequentes que não são os mais frequentes.
Veja também
Sintaxe
approx_top_sum(N[, reserved])(column, weight)
Parâmetros
N — O número de elementos a retornar. Opcional. Valor padrão: 10. UInt64
reserved — Opcional. Define quantas células são reservadas para valores. Se uniq(column) > reserved, o resultado da função topK será aproximado. Valor padrão: N * 3. O valor máximo de N é 65536. UInt64
Argumentos
column — O nome da coluna na qual encontrar os valores mais frequentes. String
weight — O peso. Cada valor é contabilizado weight vezes no cálculo da frequência. UInt64
Valor retornado
Retorna um array com os valores aproximadamente mais frequentes e suas contagens, ordenados em ordem decrescente de frequência aproximada. Array
Exemplos
Exemplo de uso
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)] │
└─────────────────────────┘
Veja também
Última modificação em 10 de junho de 2026