- ClickStack gestionado
- ClickStack Open Source
Para despliegues de producción, se recomienda Managed ClickStack. Aplica prácticas de seguridad estándar del sector de forma predeterminada, incluidas la mejora del cifrado, la autenticación y la conectividad, y controles de acceso gestionados, además de ofrecer las siguientes ventajas:
La siguiente tabla muestra ejemplos de dimensionamiento basados en un rendimiento de ingestión creciente en megabytes por segundo, junto con los volúmenes de datos correspondientes en terabytes por mes. Esto supone un promedio sostenido de 1 QPS desde ClickStack en todos los tipos de consultas (búsqueda, dashboards y alertas).
Para obtener más información sobre cómo ajustar las hipótesis de dimensionamiento para tu entorno, consulta “Ajustar las hipótesis de dimensionamiento para tu entorno”.
- Escalado automático de la capacidad de cómputo independiente del almacenamiento
- Retención de bajo costo y prácticamente ilimitada basada en almacenamiento de objetos
- La posibilidad de aislar de forma independiente las cargas de trabajo de lectura y escritura con Warehouses.
- Autenticación integrada
- Backups automatizados
- Actualizaciones sin interrupciones
Proteger la ingestión
De forma predeterminada, ClickStack OpenTelemetry Collector no está protegido cuando se despliega fuera de las distribuciones open source y no requiere autenticación en sus puertos OTLP.Para proteger la ingestión, especifica un token de autenticación al desplegar el collector mediante la variable de entornoOTLP_AUTH_TOKEN. Consulta “Proteger el collector” para obtener más información.Crear un usuario de ingestión
Se recomienda crear un usuario dedicado para el OTel collector para la ingestión en Managed ClickHouse y para garantizar que la ingestión se envíe a una base de datos específica, por ejemplo,otel. Consulta “Crear un usuario de ingestión” para obtener más información.Configurar Time To Live (TTL)
Asegúrate de que Time To Live (TTL) esté configurado adecuadamente para tu despliegue de Managed ClickStack. Esto controla durante cuánto tiempo se conservan los datos; el valor predeterminado de 3 días a menudo debe modificarse.Estimación de recursos
Lo siguiente ofrece un modelo para estimar los recursos de cómputo y almacenamiento necesarios para un despliegue de ClickStack en función del volumen de ingestión previsto. Los valores resultantes son solo estimaciones y deben utilizarse como una línea base inicial; no constituyen una respuesta prescriptiva. Los requisitos reales dependen de la complejidad de las consultas, la concurrencia, las políticas de retención y la variabilidad del rendimiento de ingestión. Supervise siempre el uso de recursos y escale según sea necesario.Al desplegar ClickStack, aprovisione cómputo para cubrir dos cargas de trabajo independientes: ingestión y consulta.| Carga de trabajo | Recursos estimados |
|---|---|
| Ingestión | 1 vCPU por cada 10 MB/s de rendimiento de ingestión sostenido |
| Consulta | 1 vCPU por 1 QPS y por cada 10 MB/s de rendimiento de ingestión sostenido |
Aislamiento de consultas frente a ingestiónEn la mayoría de los despliegues autogestionados, la ingestión y la consulta comparten los mismos nodos. En este caso, use las CPU totales como línea base. El escalado aislado —donde el cómputo de ingestión y el de consulta se aprovisionan de forma independiente— es compatible con ClickHouse Cloud mediante grupos de cómputo independientes, también conocidos como Warehouses.
Suposiciones
Suposiciones
- Una relación de compresión de 10x para el almacenamiento, normalmente conservadora para logs y traces.
- SLA de consultas con un P50 de 1.5 segundos y un P99 de 5 segundos.
- Suponemos que la mayoría de las consultas se realizan sobre datos recientes, siguiendo una distribución log-normal que alcanza su pico en torno a una hora y se extiende hasta aproximadamente seis horas. Los usuarios pueden optar por aprovisionar cómputo dedicado para consultar datos más antiguos. En ClickHouse Cloud, este puede permanecer inactivo (y, por tanto, no generar costos) cuando no se utilice.
- Aunque el cómputo de consultas puede escalarse de forma independiente del cómputo de ingestión, sigue estando intrínsecamente vinculado al volumen de ingestión. Suponemos que, a medida que aumenta la ingestión, crece la densidad de datos, lo que da lugar a mayores volúmenes de escaneo en tiempo de consulta y, en consecuencia, a mayores requisitos de cómputo para las consultas.
| MB/s | TB/mes | CPU de ingestión | CPU de consulta | CPU totales | Almacenamiento total (por mes) (GB) |
|---|---|---|---|---|---|
| 10 | 25.92 | 1 | 3 | 4 | 2,592 |
| 20 | 51.84 | 2 | 6 | 8 | 5,184 |
| 50 | 129.6 | 5 | 15 | 20 | 12,960 |
| 100 | 259.2 | 10 | 30 | 40 | 25,920 |
| 200 | 518.4 | 20 | 60 | 80 | 51,840 |
| 500 | 1,296 | 50 | 150 | 200 | 129,600 |
| 1000 | 2,592 | 100 | 300 | 400 | 259,200 |
Aislar cargas de trabajo de observabilidad
Si estás añadiendo ClickStack a un servicio de ClickHouse Cloud existente que ya admite otras cargas de trabajo, como análisis de aplicaciones en tiempo real, se recomienda encarecidamente aislar el tráfico de observabilidad.Usa Managed Warehouses para crear un servicio hijo dedicado a ClickStack. Esto te permite:- Aislar la carga de ingestión y de consultas de las aplicaciones existentes
- Escalar las cargas de trabajo de observabilidad de forma independiente
- Evitar que las consultas de observabilidad afecten a los análisis de producción
- Compartir los mismos datos subyacentes entre servicios cuando sea necesario