Saltar al contenido principal

approx_top_k

Introducido en: v1.1.0 Devuelve un array con los valores más frecuentes de forma aproximada y sus recuentos en la columna especificada. El array resultante se ordena de forma descendente según la frecuencia aproximada de los valores (no según los valores en sí). Esta función no garantiza el resultado. En determinadas situaciones, pueden producirse errores y podría devolver valores frecuentes que no sean los más frecuentes. Sintaxis
approx_top_k(N[, reserved])(column)
Alias: approx_top_count Parámetros
  • N — El número de elementos que se devolverán. Valor predeterminado: 10. El valor máximo de N es 65536. UInt64
  • reserved — Opcional. Define cuántas celdas se reservan para los valores. Si uniq(column) > reserved, el resultado será aproximado. Valor predeterminado: N * 3. UInt64
Argumentos
  • column — El nombre de la columna para la que se buscan los valores más frecuentes. String
Valor devuelto Devuelve un array con los valores aproximadamente más frecuentes y sus recuentos, ordenados en orden descendente de frecuencia aproximada. Array Ejemplos Ejemplo de uso
Query
SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));
Response
┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘
Ver también
Última modificación el 10 de junio de 2026