메인 콘텐츠로 건너뛰기

varSamp

도입 버전: v1.1.0 데이터 집합의 표본 분산(sample variance)을 계산합니다. 표본 분산은 다음 공식으로 계산됩니다: Σ(xxˉ)2n1\frac{\Sigma{(x - \bar{x})^2}}{n-1}
여기서:
  • xx는 데이터 집합의 각 데이터 포인트입니다
  • xˉ\bar{x}는 데이터 집합의 산술 평균(arithmetic mean)입니다
  • nn은 데이터 집합의 데이터 포인트 수입니다
이 함수는 입력 데이터 집합이 더 큰 모집단에서 추출한 표본이라고 가정합니다. 전체 모집단의 분산을 계산하려면(완전한 데이터 집합이 있는 경우) varPop을 사용하십시오.
이 함수는 수치적으로 불안정한 알고리즘을 사용합니다. 계산에서 수치 안정성이 필요한 경우 varSampStable 함수를 사용하십시오. 처리 속도는 느리지만 계산 오차가 더 낮습니다.
구문
varSamp(x)
별칭: VAR_SAMP 인수 반환 값 입력 데이터 집합 x의 표본 분산을 반환합니다. Float64 예시 표본 분산 계산
Query
DROP TABLE IF EXISTS test_data;
CREATE TABLE test_data
(
    x Float64
)
ENGINE = Memory;

INSERT INTO test_data VALUES (10.5), (12.3), (9.8), (11.2), (10.7);

SELECT round(varSamp(x),3) AS var_samp FROM test_data;
Response
┌─var_samp─┐
│    0.865 │
└──────────┘
마지막 수정일 2026년 6월 10일