approx_top_k

도입 버전: v1.1.0 지정한 컬럼에서 대략적으로 가장 자주 나타나는 값들과 그 개수를 배열로 반환합니다. 반환된 배열은 값 자체가 아니라 값의 대략적인 빈도를 기준으로 내림차순 정렬됩니다. 이 함수는 결과를 보장하지 않습니다. 특정 상황에서는 오류가 발생할 수 있으며, 실제로 가장 빈도가 높은 값이 아닌 자주 나타나는 값이 반환될 수 있습니다. 구문

approx_top_k(N[, reserved])(column)

별칭: approx_top_count 매개변수

N — 반환할 요소의 수입니다. 기본값은 10입니다. N의 최댓값은 65536입니다. UInt64
reserved — 선택 사항입니다. 값을 저장하기 위해 예약할 셀 수를 지정합니다. uniq(column) > reserved이면 결과는 근사값이 됩니다. 기본값은 N * 3입니다. UInt64

인수

column — 가장 자주 나타나는 값을 찾을 컬럼 이름입니다. String

반환 값 근사 빈도 기준으로 내림차순 정렬된, 대략 가장 자주 나타나는 값과 해당 개수의 배열을 반환합니다. Array 예시 사용 예시

Query

SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));

Response

┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘

관련 항목

​approx_top_k

approx_top_k