跳转到主要内容

cramersV

引入版本:v22.1.0 Cramer’s V (有时也称为 Cramer’s phi) 是衡量表中两列之间关联性的指标。 cramersV 函数的结果范围为 0 到 1,其中 0 表示变量之间不存在关联性;只有当每个值都完全由另一个值决定时,结果才可能达到 1。 它也可以理解为两个变量之间的关联性占其最大可能变异的百分比。
如需 Cramer’s V 的偏差校正版本,请参见:cramersVBiasCorrected
语法
cramersV(column1, column2)
参数 返回值 返回一个介于 0 (表示列值之间没有关联性) 和 1 (完全关联) 之间的值。Float64 示例 列之间没有关联性
Query
SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );
Response
┌─cramersV(a, b)─┐
│              0 │
└────────────────┘
列之间的高度关联性
Query
SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            if (number % 12 = 0, (number + 1) % 5, number % 5) AS b
        FROM
            numbers(150)
    );
Response
┌─────cramersV(a, b)─┐
│ 0.9066801892162646 │
└────────────────────┘
最后修改于 2026年6月10日