Introducido en: v1.1.0
Devuelve un array con los valores más frecuentes de forma aproximada y sus recuentos en la columna especificada.
El array resultante se ordena de forma descendente según la frecuencia aproximada de los valores (no por los valores en sí).
Además, se tiene en cuenta el peso del valor.
Esta función no garantiza el resultado.
En determinadas situaciones, podrían producirse errores y podría devolver valores frecuentes que no sean los más frecuentes.
Ver también
Sintaxis
approx_top_sum(N[, reserved])(column, weight)
Parámetros
N — El número de elementos que se devolverán. Opcional. Valor predeterminado: 10. UInt64
reserved — Opcional. Define cuántas celdas se reservan para los valores. Si uniq(column) > reserved, el resultado de la función topK será aproximado. Valor predeterminado: N * 3. El valor máximo de N es 65536. UInt64
Argumentos
column — El nombre de la columna cuyos valores más frecuentes se desean encontrar. String
weight — El peso. Cada valor se contabiliza weight veces para el cálculo de la frecuencia. UInt64
Valor devuelto
Devuelve un array con los valores más frecuentes aproximados y sus recuentos, ordenados en orden descendente de frecuencia aproximada. Array
Ejemplos
Ejemplo de uso
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)] │
└─────────────────────────┘
Véase también
Última modificación el 10 de junio de 2026