Saltar al contenido principal
Los servicios de ClickHouse Cloud incluyen componentes de monitoreo listos para usar que proporcionan a los usuarios paneles y notificaciones. De forma predeterminada, todos los usuarios de la consola de ClickHouse Cloud pueden acceder a estos paneles.

Paneles

Estado del servicio

El panel Service Health puede usarse para supervisar el estado general de un servicio. ClickHouse Cloud recopila y almacena las métricas que se muestran en este panel a partir de las tablas del sistema para que puedan consultarse cuando un servicio se suspende por inactividad.

Utilización de recursos

El panel Infrastructure ofrece una vista detallada de los recursos que utiliza el proceso de ClickHouse. ClickHouse Cloud recopila y almacena las métricas que se muestran en este panel a partir de las tablas del sistema, para que puedan consultarse cuando un servicio esté inactivo.

Memoria y CPU

Los gráficos de CPU asignada y Memoria asignada muestran los recursos de cómputo totales disponibles para cada réplica de su servicio. Estas asignaciones pueden modificarse mediante las funciones de escalado de ClickHouse Cloud. Los gráficos de Uso de memoria y Uso de CPU estiman cuánta CPU y memoria están utilizando realmente los procesos de ClickHouse en cada réplica, incluidas las consultas y los procesos en segundo plano, como las fusiones.
Degradación del rendimientoSi el uso de memoria o CPU se acerca a la memoria o CPU asignadas, es posible que empiece a experimentar una degradación del rendimiento. Para solucionarlo, recomendamos:
  • Optimizar sus consultas
  • Cambiar la partición de sus motores de tabla
  • Añadir más recursos de cómputo a su servicio mediante el escalado
Estas son las métricas de la tabla del sistema correspondientes que se muestran en estos gráficos:
GráficoNombre de la métrica correspondienteAgregaciónNotas
Memoria asignadaCGroupMemoryTotalMáx.
CPU asignadaCGroupMaxCPUMáx.
Memoria usadaMemoryResidentMáx.
CPU usadaMétrica de CPU del sistemaMáx.ClickHouseServer_UsageCores a través del endpoint de Prometheus

Transferencia de datos

Los gráficos muestran el ingreso y la salida de datos de ClickHouse Cloud. Más información sobre la transferencia de datos por red.

Panel avanzado

Este panel es una versión modificada del panel avanzado de observabilidad integrado, donde cada serie representa métricas por réplica. Este panel puede ser útil para supervisar y diagnosticar problemas específicos de ClickHouse.
ClickHouse Cloud recopila y almacena, a partir de tablas del sistema, las métricas que se muestran en este panel para que puedan consultarse incluso cuando un servicio está inactivo. Acceder a estas métricas no emite ninguna consulta al servicio subyacente y no reactivará servicios inactivos.
La tabla siguiente relaciona cada gráfico del Panel avanzado con la métrica correspondiente de ClickHouse, la tabla del sistema de origen y el tipo de agregación:
GráficoNombre de la métrica correspondiente de ClickHouseTabla del sistemaTipo de agregación
Consultas/sProfileEvent_Querymetric_logSum / bucketSizeSeconds
Consultas en ejecuciónCurrentMetric_Querymetric_logAvg
Fusiones en ejecuciónCurrentMetric_Mergemetric_logAvg
Bytes seleccionados/sProfileEvent_SelectedBytesmetric_logSum / bucketSizeSeconds
Espera de E/SProfileEvent_OSIOWaitMicrosecondsmetric_logSum / bucketSizeSeconds
Espera de lectura de S3ProfileEvent_ReadBufferFromS3Microsecondsmetric_logSum / bucketSizeSeconds
Errores de lectura de S3/sProfileEvent_ReadBufferFromS3RequestsErrorsmetric_logSum / bucketSizeSeconds
Espera de CPUProfileEvent_OSCPUWaitMicrosecondsmetric_logSum / bucketSizeSeconds
Uso de CPU del SO (userspace, normalizado)OSUserTimeNormalizedasynchronous_metric_log
Uso de CPU del SO (kernel, normalizado)OSSystemTimeNormalizedasynchronous_metric_log
Lectura desde discoProfileEvent_OSReadBytesmetric_logSum / bucketSizeSeconds
Lectura desde el filesystemProfileEvent_OSReadCharsmetric_logSum / bucketSizeSeconds
Memoria monitorizada (bytes)CurrentMetric_MemoryTrackingmetric_log
Total de partes de MergeTreeTotalPartsOfMergeTreeTablesasynchronous_metric_log
Máx. partes por particiónMaxPartCountForPartitionasynchronous_metric_log
Lectura desde S3ProfileEvent_ReadBufferFromS3Bytesmetric_logSum / bucketSizeSeconds
Tamaño de la caché del filesystemCurrentMetric_FilesystemCacheSizemetric_log
Solicitudes de escritura de Disk S3/sProfileEvent_DiskS3PutObject + ProfileEvent_DiskS3UploadPart + ProfileEvent_DiskS3CreateMultipartUpload + ProfileEvent_DiskS3CompleteMultipartUploadmetric_logSum / bucketSizeSeconds
Solicitudes de lectura de Disk S3/sProfileEvent_DiskS3GetObject + ProfileEvent_DiskS3HeadObject + ProfileEvent_DiskS3ListObjectsmetric_logSum / bucketSizeSeconds
Tasa de aciertos de la caché de FSsum(ProfileEvent_CachedReadBufferReadFromCacheBytes) / (sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) + sum(ProfileEvent_CachedReadBufferReadFromSourceBytes))metric_log
Tasa de aciertos de la caché de páginasgreatest(0, (sum(ProfileEvent_OSReadChars) - sum(ProfileEvent_OSReadBytes)) / (sum(ProfileEvent_OSReadChars) + sum(ProfileEvent_ReadBufferFromS3Bytes)))metric_log
Bytes recibidos por red/sNetworkReceiveBytesasynchronous_metric_logSum / bucketSizeSeconds
Bytes enviados por red/sNetworkSendBytesasynchronous_metric_logSum / bucketSizeSeconds
Conexiones TCP concurrentesCurrentMetric_TCPConnectionmetric_log
Conexiones MySQL concurrentesCurrentMetric_MySQLConnectionmetric_log
Conexiones HTTP concurrentesCurrentMetric_HTTPConnectionmetric_log
Para obtener información detallada sobre cada visualización y sobre cómo utilizarlas para diagnosticar problemas, consulta la documentación del panel avanzado.

Query insights

La función Query Insights hace que el registro de consultas integrado de ClickHouse sea más fácil de usar mediante diversas visualizaciones y tablas. La tabla system.query_log de ClickHouse es una fuente clave de información para la optimización de consultas, la depuración y la supervisión del estado general y el rendimiento del clúster. Después de seleccionar un servicio, el elemento de navegación Monitoring en la barra lateral izquierda se despliega para mostrar un subelemento Query insights:

Métricas de nivel superior

Los recuadros de estadísticas de la parte superior representan métricas básicas de las consultas para el periodo de tiempo seleccionado. Debajo, los gráficos de series temporales muestran el volumen de consultas, la latencia y la tasa de errores, desglosados por tipo de consulta (select, insert, otras). El gráfico de latencia puede ajustarse para mostrar las latencias p50, p90 y p99:

Consultas recientes

Una tabla muestra las entradas del log de consultas agrupadas por el hash de la consulta normalizada y el usuario dentro de la ventana de tiempo seleccionada. Las consultas recientes se pueden filtrar y ordenar por cualquier campo disponible, y la tabla puede configurarse para mostrar u ocultar campos adicionales, como tablas y las latencias p90 y p99:

Desglose de consultas

Al seleccionar una consulta en la tabla Recent queries, se abrirá un flyout con métricas e información específicas de la consulta seleccionada: Todas las métricas de la pestaña Query info son métricas agregadas, pero también podemos ver las métricas de ejecuciones individuales al seleccionar la pestaña Query history: Desde este panel, se pueden expandir los elementos Settings y Profile Events de cada ejecución de consulta para mostrar información adicional.
  • Notificaciones — Configura alertas para eventos de escalado, errores y facturación
  • panel avanzado — Referencia detallada de cada visualización del panel
  • Consultar tablas del sistema — Ejecuta consultas SQL personalizadas sobre tablas del sistema para una introspección más profunda
  • Endpoint de Prometheus — Exporta métricas a Grafana, Datadog u otras herramientas compatibles con Prometheus
Última modificación el 10 de junio de 2026