approx_top_k

Introducido en: v1.1.0 Devuelve un array con los valores más frecuentes de forma aproximada y sus recuentos en la columna especificada. El array resultante se ordena de forma descendente según la frecuencia aproximada de los valores (no según los valores en sí). Esta función no garantiza el resultado. En determinadas situaciones, pueden producirse errores y podría devolver valores frecuentes que no sean los más frecuentes. Sintaxis

approx_top_k(N[, reserved])(column)

Alias: approx_top_count Parámetros

N — El número de elementos que se devolverán. Valor predeterminado: 10. El valor máximo de N es 65536. UInt64
reserved — Opcional. Define cuántas celdas se reservan para los valores. Si uniq(column) > reserved, el resultado será aproximado. Valor predeterminado: N * 3. UInt64

Argumentos

column — El nombre de la columna para la que se buscan los valores más frecuentes. String

Valor devuelto Devuelve un array con los valores aproximadamente más frecuentes y sus recuentos, ordenados en orden descendente de frecuencia aproximada. Array Ejemplos Ejemplo de uso

Query

SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));

Response

┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘

Ver también

​approx_top_k

approx_top_k