Dashboards
Saúde do serviço
Utilização de recursos
Memória e CPU
Degradação de desempenhoSe a utilização de memória ou CPU estiver se aproximando da memória ou CPU alocada, você poderá começar a perceber degradação no desempenho. Para resolver, recomendamos:
- Otimizar suas consultas
- Alterar o particionamento dos seus motores de tabela
- Adicionar mais capacidade computacional ao seu serviço usando escalonamento
| Gráfico | Nome da métrica correspondente | Agregação | Observações |
|---|---|---|---|
| Memória alocada | CGroupMemoryTotal | Máx | |
| CPU alocada | CGroupMaxCPU | Máx | |
| Memória usada | MemoryResident | Máx | |
| CPU usada | Métrica de CPU do sistema | Máx | ClickHouseServer_UsageCores via endpoint do Prometheus |
Transferência de dados
Dashboard avançado
O ClickHouse Cloud coleta e armazena as métricas exibidas neste dashboard a partir de tabelas do sistema, para que elas possam ser visualizadas mesmo quando um serviço estiver inativo. O acesso a essas métricas não emite uma consulta para o serviço subjacente e não reativará serviços inativos.
| Gráfico | Nome da métrica correspondente no ClickHouse | Tabela do sistema | Tipo de agregação |
|---|---|---|---|
| Consultas/s | ProfileEvent_Query | metric_log | Sum / bucketSizeSeconds |
| Consultas em execução | CurrentMetric_Query | metric_log | Avg |
| Merges em execução | CurrentMetric_Merge | metric_log | Avg |
| Bytes selecionados/s | ProfileEvent_SelectedBytes | metric_log | Sum / bucketSizeSeconds |
| Espera de E/S | ProfileEvent_OSIOWaitMicroseconds | metric_log | Sum / bucketSizeSeconds |
| Espera na leitura do S3 | ProfileEvent_ReadBufferFromS3Microseconds | metric_log | Sum / bucketSizeSeconds |
| Erros de leitura do S3/s | ProfileEvent_ReadBufferFromS3RequestsErrors | metric_log | Sum / bucketSizeSeconds |
| Espera de CPU | ProfileEvent_OSCPUWaitMicroseconds | metric_log | Sum / bucketSizeSeconds |
| Uso de CPU do SO (userspace, normalizado) | OSUserTimeNormalized | asynchronous_metric_log | |
| Uso de CPU do SO (kernel, normalizado) | OSSystemTimeNormalized | asynchronous_metric_log | |
| Leitura do disco | ProfileEvent_OSReadBytes | metric_log | Sum / bucketSizeSeconds |
| Leitura do filesystem | ProfileEvent_OSReadChars | metric_log | Sum / bucketSizeSeconds |
| Memória (rastreada, bytes) | CurrentMetric_MemoryTracking | metric_log | |
| Total de partes do MergeTree | TotalPartsOfMergeTreeTables | asynchronous_metric_log | |
| Máx. de partes por partição | MaxPartCountForPartition | asynchronous_metric_log | |
| Leitura do S3 | ProfileEvent_ReadBufferFromS3Bytes | metric_log | Sum / bucketSizeSeconds |
| Tamanho do cache do filesystem | CurrentMetric_FilesystemCacheSize | metric_log | |
| Requisições de gravação no Disk S3/s | ProfileEvent_DiskS3PutObject + ProfileEvent_DiskS3UploadPart + ProfileEvent_DiskS3CreateMultipartUpload + ProfileEvent_DiskS3CompleteMultipartUpload | metric_log | Sum / bucketSizeSeconds |
| Requisições de leitura no Disk S3/s | ProfileEvent_DiskS3GetObject + ProfileEvent_DiskS3HeadObject + ProfileEvent_DiskS3ListObjects | metric_log | Sum / bucketSizeSeconds |
| Taxa de acerto do cache do filesystem | sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) / (sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) + sum(ProfileEvent_CachedReadBufferReadFromSourceBytes)) | metric_log | |
| Taxa de acerto do cache de páginas | greatest(0, (sum(ProfileEvent_OSReadChars) - sum(ProfileEvent_OSReadBytes)) / (sum(ProfileEvent_OSReadChars) + sum(ProfileEvent_ReadBufferFromS3Bytes))) | metric_log | |
| Bytes recebidos pela rede/s | NetworkReceiveBytes | asynchronous_metric_log | Sum / bucketSizeSeconds |
| Bytes enviados pela rede/s | NetworkSendBytes | asynchronous_metric_log | Sum / bucketSizeSeconds |
| Conexões TCP simultâneas | CurrentMetric_TCPConnection | metric_log | |
| Conexões MySQL simultâneas | CurrentMetric_MySQLConnection | metric_log | |
| Conexões HTTP simultâneas | CurrentMetric_HTTPConnection | metric_log |
Query insights
system.query_log do ClickHouse é uma fonte essencial de informações para otimização de consultas, depuração e monitoramento da integridade e do desempenho gerais do cluster.
Após selecionar um serviço, o item de navegação Monitoring na barra lateral esquerda se expande e revela o subitem Query insights:
Métricas principais
Recent queries
Detalhamento da consulta
Settings e Profile Events de cada execução da consulta podem ser expandidos para mostrar informações adicionais.
- Notificações — Configure alertas para eventos de escalonamento, erros e faturamento
- Dashboard avançado — Referência detalhada de cada visualização do dashboard
- Consultando tabelas do sistema — Execute consultas SQL personalizadas em tabelas do sistema para uma introspecção mais aprofundada
- Endpoint do Prometheus — Exporte métricas para o Grafana, o Datadog ou outras ferramentas compatíveis com Prometheus