Pular para o conteúdo principal

topKWeighted

Introduzido em: v1.1.0 Retorna um array dos valores mais frequentes aproximados na coluna especificada. O array resultante é ordenado em ordem decrescente da frequência aproximada dos valores (e não dos próprios valores). Além disso, o peso do valor é levado em consideração. Veja também Sintaxe
topKWeighted(N)(column, weight)
topKWeighted(N, load_factor)(column, weight)
topKWeighted(N, load_factor, 'counts')(column, weight)
Parâmetros
  • N — Número de elementos a serem retornados. Valor padrão: 10. UInt64
  • load_factor — Opcional. Define quantas células são reservadas para os valores. Se uniq(column) > N * load_factor, o resultado da função topK será aproximado. Valor padrão: 3. UInt64
  • counts — Opcional. Define se o resultado deve conter uma contagem aproximada e um valor de erro. Bool
Argumentos
  • column — O nome da coluna para a qual devem ser encontrados os valores mais frequentes. - weight — O peso. Cada valor é contabilizado weight vezes no cálculo da frequência. UInt64
Valor retornado Retorna um array com os valores que têm a maior soma aproximada de pesos. Array Exemplos Exemplo de uso
Query
SELECT topKWeighted(2)(k, w) FROM
VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─topKWeighted(2)(k, w)──┐
│ ['z','x']              │
└────────────────────────┘
Com o parâmetro counts
Query
SELECT topKWeighted(2, 10, 'counts')(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─topKWeighted(2, 10, 'counts')(k, w)─┐
│ [('z',10,0),('x',5,0)]              │
└─────────────────────────────────────┘
Veja também
Última modificação em 10 de junho de 2026