간단한 균등 분포 데이터셋
rand() % 10000: 1만 명 사용자에 대한 균등 분포arrayElement(...): 3가지 이벤트 유형 중 하나를 무작위로 선택합니다- 타임스탬프는 직전 24시간에 걸쳐 분포합니다
지수 분포
- 최근 기간 전반에 걸쳐 균등한 타임스탬프
randExponential(1/10)— 대부분의 값은 0에 가깝고, 최소값으로 15를 더해 보정합니다([ClickHouse][1], [ClickHouse][2], [Atlantic.Net][3], [GitHub][4])
시간대별 이벤트 분포 (Poisson)
- 이벤트는 정오 무렵에 가장 많이 발생하며, 편차는 포아송 분포를 따릅니다
시간에 따라 변화하는 정규 분포
usage는 일주기성 사인파 + 무작위성을 따릅니다- 값은 [0,100] 범위로 제한됩니다
범주형 및 중첩 데이터
- 배열 길이는 1–3 사이에서 무작위로 지정
- 각 관심사마다 사용자별 점수 3개
무작위 테이블 생성
generateRandomStructure 함수는 테스트, 벤치마크, 또는 임의의 스키마(schema)를 가진 모의 데이터를 생성할 때 generateRandom 테이블 엔진과 함께 사용하면 특히 유용합니다.
먼저 generateRandomStructure 함수를 사용해 무작위 구조가 어떤 모습인지 살펴보겠습니다:
DESCRIBE 문을 사용해 생성된 결과를 확인하세요: