quantileGK
quantile de una secuencia de datos numéricos mediante el algoritmo Greenwald-Khanna.
El algoritmo Greenwald-Khanna se utiliza para calcular cuantiles en un flujo de datos de forma muy eficiente.
Fue introducido por Michael Greenwald y Sanjeev Khanna en 2001.
Se usa ampliamente en bases de datos y sistemas de big data donde es necesario calcular cuantiles precisos sobre grandes flujos de datos en tiempo real.
El algoritmo es muy eficiente, ya que solo requiere O(log n) de espacio y O(log log n) de tiempo por elemento (donde n es el tamaño de la entrada).
También es muy preciso, ya que proporciona un valor de cuantil aproximado con alta probabilidad.
quantileGK se diferencia de otras funciones de cuantiles de ClickHouse porque permite al usuario controlar la precisión del resultado aproximado del cuantil.
Sintaxis
medianGK
Parámetros
accuracy— Precisión del cuantil. Entero positivo constante. Un valor de precisión más alto implica un menor error. Por ejemplo, si el argumentoaccuracyse establece en 100, el cuantil calculado tendrá un error no superior al 1 % con alta probabilidad. Existe un equilibrio entre la precisión de los cuantiles calculados y la complejidad computacional del algoritmo. Una precisión mayor requiere más memoria y recursos computacionales para calcular el cuantil con exactitud, mientras que un valor menor deaccuracypermite un cálculo más rápido y con un uso de memoria más eficiente, aunque con una precisión ligeramente inferior.UInt*level— Opcional. Nivel del cuantil. Número constante de punto flotante entre 0 y 1. Valor predeterminado: 0.5. Conlevel=0.5, la función calcula la mediana.Float*
expr— Expresión sobre los valores de la columna que da como resultado tipos de datos numéricos, Date o DateTime.(U)Int*oFloat*oDecimal*oDateoDateTime
Float64 o Date o DateTime
Ejemplos
Cálculo del cuantil con distintos niveles de precisión
Query
Response
Query
Response