Conjunto de datos simple con distribución uniforme
rand() % 10000: distribución uniforme de 10k usuariosarrayElement(...): selecciona aleatoriamente uno de los tres tipos de eventos- Marcas de tiempo distribuidas a lo largo de las 24 horas anteriores
Distribución exponencial
- Marcas de tiempo distribuidas uniformemente durante un período reciente
randExponential(1/10)— la mayoría de los valores cerca de 0, con un desplazamiento mínimo de 15 ([ClickHouse][1], [ClickHouse][2], [Atlantic.Net][3], [GitHub][4])
Eventos distribuidos temporalmente (Poisson)
- Los eventos alcanzan su punto máximo alrededor del mediodía, con una desviación con distribución de Poisson
Distribución normal que varía con el tiempo
usagesigue una onda sinusoidal diurna + variación aleatoria- Valores acotados a [0,100]
Datos categóricos y anidados
- Longitud aleatoria del array de 1 a 3
- Tres puntuaciones por usuario para cada interés
Generación de tablas aleatorias
generateRandomStructure es especialmente útil cuando se combina con el generateRandom table engine para pruebas, benchmarking o la creación de datos ficticios con esquemas arbitrarios.
Comencemos viendo cómo es una estructura aleatoria con la función generateRandomStructure:
DESCRIBE para ver qué hemos creado: