approx_top_k

Introduzido em: v1.1.0 Retorna um array com os valores aproximadamente mais frequentes e suas contagens na coluna especificada. O array resultante é ordenado em ordem decrescente pela frequência aproximada dos valores (não pelos próprios valores). Esta função não garante um resultado. Em determinadas situações, podem ocorrer erros, e ela pode retornar valores frequentes que não sejam os mais frequentes. Sintaxe

approx_top_k(N[, reserved])(column)

Aliases: approx_top_count Parâmetros

N — O número de elementos a retornar. Valor padrão: 10. Valor máximo de N = 65536. UInt64
reserved — Opcional. Define quantas células serão reservadas para os valores. Se uniq(column) > reserved, o resultado será aproximado. Valor padrão: N * 3. UInt64

Argumentos

column — O nome da coluna da qual se deseja encontrar os valores mais frequentes. String

Valor retornado Retorna um array com os valores aproximados mais frequentes e suas contagens, ordenados em ordem decrescente de frequência aproximada. Array Exemplos Exemplo de uso

Query

SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));

Response

┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘

Veja também

​approx_top_k

approx_top_k