Pular para o conteúdo principal

approx_top_sum

Introduzido em: v1.1.0 Retorna um array com os valores aproximadamente mais frequentes e suas contagens na coluna especificada. O array resultante é ordenado em ordem decrescente pela frequência aproximada dos valores (e não pelos próprios valores). Além disso, o peso de cada valor é levado em conta. Esta função não garante um resultado. Em determinadas situações, podem ocorrer erros, e ela pode retornar valores frequentes que não são os mais frequentes. Veja também Sintaxe
approx_top_sum(N[, reserved])(column, weight)
Parâmetros
  • N — O número de elementos a retornar. Opcional. Valor padrão: 10. UInt64
  • reserved — Opcional. Define quantas células são reservadas para valores. Se uniq(column) > reserved, o resultado da função topK será aproximado. Valor padrão: N * 3. O valor máximo de N é 65536. UInt64
Argumentos
  • column — O nome da coluna na qual encontrar os valores mais frequentes. String
  • weight — O peso. Cada valor é contabilizado weight vezes no cálculo da frequência. UInt64
Valor retornado Retorna um array com os valores aproximadamente mais frequentes e suas contagens, ordenados em ordem decrescente de frequência aproximada. Array Exemplos Exemplo de uso
Query
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)]  │
└─────────────────────────┘
Veja também
Última modificação em 10 de junho de 2026