Перейти к основному содержанию

topKWeighted

Добавленный в: v1.1.0 Возвращает массив приблизительно наиболее часто встречающихся значений в указанном столбце. Результирующий массив сортируется по убыванию приблизительной частоты значений (а не самих значений). Кроме того, учитывается вес значения. См. также Синтаксис
topKWeighted(N)(column, weight)
topKWeighted(N, load_factor)(column, weight)
topKWeighted(N, load_factor, 'counts')(column, weight)
Параметры
  • N — Количество возвращаемых элементов. Значение по умолчанию: 10. UInt64
  • load_factor — Необязательно. Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > N * load_factor, результат функции topK будет приблизительным. Значение по умолчанию: 3. UInt64
  • counts — Необязательно. Определяет, должен ли результат содержать приблизительный счётчик и значение ошибки. Bool
Аргументы
  • column — Имя столбца, для которого нужно найти наиболее часто встречающиеся значения. - weight — Вес. При вычислении частоты каждое значение учитывается weight раз. UInt64
Возвращаемое значение Возвращает массив значений с максимальной приблизительной суммой весов. Array Примеры Пример использования
Query
SELECT topKWeighted(2)(k, w) FROM
VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─topKWeighted(2)(k, w)──┐
│ ['z','x']              │
└────────────────────────┘
С параметром counts
Query
SELECT topKWeighted(2, 10, 'counts')(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─topKWeighted(2, 10, 'counts')(k, w)─┐
│ [('z',10,0),('x',5,0)]              │
└─────────────────────────────────────┘
См. также
Последнее изменение 10 июня 2026 г.