Pular para o conteúdo principal

approx_top_k

Introduzido em: v1.1.0 Retorna um array com os valores aproximadamente mais frequentes e suas contagens na coluna especificada. O array resultante é ordenado em ordem decrescente pela frequência aproximada dos valores (não pelos próprios valores). Esta função não garante um resultado. Em determinadas situações, podem ocorrer erros, e ela pode retornar valores frequentes que não sejam os mais frequentes. Sintaxe
approx_top_k(N[, reserved])(column)
Aliases: approx_top_count Parâmetros
  • N — O número de elementos a retornar. Valor padrão: 10. Valor máximo de N = 65536. UInt64
  • reserved — Opcional. Define quantas células serão reservadas para os valores. Se uniq(column) > reserved, o resultado será aproximado. Valor padrão: N * 3. UInt64
Argumentos
  • column — O nome da coluna da qual se deseja encontrar os valores mais frequentes. String
Valor retornado Retorna um array com os valores aproximados mais frequentes e suas contagens, ordenados em ordem decrescente de frequência aproximada. Array Exemplos Exemplo de uso
Query
SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘
Veja também
Última modificação em 10 de junho de 2026