quantileTDigestWeighted

도입 버전: v20.1.0 t-digest 알고리즘을 사용해 숫자 데이터 시퀀스의 근사 분위수를 계산합니다. 이 함수는 시퀀스 각 원소의 가중치를 고려합니다. 최대 오류는 1%입니다. 메모리 사용량은 log(n)이며, 여기서 n은 값의 개수입니다. 이 함수의 성능은 quantile이나 quantileTiming보다 낮습니다. State 크기 대비 정밀도 비율 측면에서는 이 함수가 quantile보다 훨씬 우수합니다. 결과는 쿼리 실행 순서에 따라 달라지므로 비결정적입니다. 하나의 쿼리에서 서로 다른 수준의 여러 quantile* 함수를 사용하면 내부 상태가 결합되지 않습니다(즉, 쿼리가 가능했던 것보다 비효율적으로 동작합니다). 이 경우 quantiles 함수를 사용하십시오.

quantileTDigestWeighted는 매우 작은 데이터 세트에는 권장되지 않으며, 상당한 오류를 초래할 수 있습니다. 이 경우 대신 quantileTDigest 사용을 고려하십시오.

구문

quantileTDigestWeighted(level)(expr, weight)

별칭: medianTDigestWeighted 매개변수

level — 선택 사항입니다. 분위수 수준입니다. 0부터 1까지의 상수 부동소수점 수입니다. level 값은 [0.01, 0.99] 범위에서 사용하는 것을 권장합니다. 기본값은 0.5입니다. level=0.5이면 함수는 중앙값을 계산합니다. Float*

인수

expr — 컬럼 값에 대한 표현식으로, 결과는 숫자 데이터 타입, Date 또는 DateTime이어야 합니다. (U)Int* 또는 Float* 또는 Decimal* 또는 Date 또는 DateTime
weight — 시퀀스 요소의 가중치가 들어 있는 컬럼입니다. 가중치는 값의 출현 횟수를 의미합니다. UInt*

반환 값 지정된 수준의 근사 분위수입니다. Float64 또는 Date 또는 DateTime 예시 t-digest를 사용한 가중 분위수 계산

Query

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10);

Response

┌─quantileTDigestWeighted(number, 1)─┐
│                                4.5 │
└────────────────────────────────────┘

관련 항목

​quantileTDigestWeighted

quantileTDigestWeighted