Saltar al contenido principal

approx_top_sum

Introducido en: v1.1.0 Devuelve un array con los valores más frecuentes de forma aproximada y sus recuentos en la columna especificada. El array resultante se ordena de forma descendente según la frecuencia aproximada de los valores (no por los valores en sí). Además, se tiene en cuenta el peso del valor. Esta función no garantiza el resultado. En determinadas situaciones, podrían producirse errores y podría devolver valores frecuentes que no sean los más frecuentes. Ver también Sintaxis
approx_top_sum(N[, reserved])(column, weight)
Parámetros
  • N — El número de elementos que se devolverán. Opcional. Valor predeterminado: 10. UInt64
  • reserved — Opcional. Define cuántas celdas se reservan para los valores. Si uniq(column) > reserved, el resultado de la función topK será aproximado. Valor predeterminado: N * 3. El valor máximo de N es 65536. UInt64
Argumentos
  • column — El nombre de la columna cuyos valores más frecuentes se desean encontrar. String
  • weight — El peso. Cada valor se contabiliza weight veces para el cálculo de la frecuencia. UInt64
Valor devuelto Devuelve un array con los valores más frecuentes aproximados y sus recuentos, ordenados en orden descendente de frecuencia aproximada. Array Ejemplos Ejemplo de uso
Query
SELECT approx_top_sum(2)(k, w)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_sum(2)(k, w)─┐
│ [('z',10,0),('x',5,0)]  │
└─────────────────────────┘
Véase también
Última modificación el 10 de junio de 2026