跳转到主要内容

quantileTDigestWeighted

引入版本:v20.1.0 使用 t-digest 算法计算数值数据序列的近似分位数。 该函数会将序列中每个元素的权重考虑在内。 最大误差为 1%。 内存消耗为 log(n),其中 n 为值的数量。 该函数的性能低于 quantilequantileTiming。 但从状态大小与精度的比率来看,该函数明显优于 quantile 结果取决于查询的执行顺序,因此是非确定性的。 当在一个查询中使用多个不同级别的 quantile* 函数时,内部状态不会被合并 (也就是说,查询的效率会低于原本可能达到的水平) 。 在这种情况下,请使用 quantiles 函数。
不建议将 quantileTDigestWeighted 用于极小的数据集,否则可能会导致较大误差。 在这种情况下,可以考虑改用 quantileTDigest
语法
quantileTDigestWeighted(level)(expr, weight)
别名: medianTDigestWeighted 参数
  • level — 可选。分位数的级别。取值为 0 到 1 之间的常量浮点数。建议将 level 设为 [0.01, 0.99] 范围内的值。默认值:0.5。当 level=0.5 时,该函数计算中位数。Float*
参数项
  • expr — 基于列值的表达式,结果必须为数值 data types、Date 或 DateTime。(U)Int*Float*Decimal*DateDateTime
  • weight — 包含序列元素权重的列。权重表示值出现的次数。UInt*
返回值 指定级别的近似分位数。Float64DateDateTime 示例 使用 t-digest 计算加权分位数
Query
SELECT quantileTDigestWeighted(number, 1) FROM numbers(10);
Response
┌─quantileTDigestWeighted(number, 1)─┐
│                                4.5 │
└────────────────────────────────────┘
另请参阅
最后修改于 2026年6月10日