Pular para o conteúdo principal
Consultas no ClickHouse CloudOs dados nesta tabela de sistema são mantidos localmente em cada nó do ClickHouse Cloud. Portanto, para obter uma visão completa de todos os dados, é necessário usar a função clusterAllReplicas. Consulte aqui para mais detalhes.

Descrição

Contém métricas calculadas periodicamente em segundo plano. Por exemplo, a quantidade de RAM em uso.

Colunas

  • metric (String) — Nome da métrica.
  • value (Float64) — Valor da métrica.
  • description (String - Descrição da métrica)

Exemplo

SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Time in seconds spent for calculation of asynchronous metrics (this is the overhead of asynchronous metrics).                                                                                                                                              │
│ NumberOfDetachedByUserParts             │          0 │ The total number of parts detached from MergeTree tables by users with the `ALTER TABLE DETACH` query (as opposed to unexpected, broken or ignored parts). The server does not care about detached parts and they can be removed.                          │
│ NumberOfDetachedParts                   │          0 │ The total number of parts detached from MergeTree tables. A part can be detached by a user with the `ALTER TABLE DETACH` query or by the server itself it the part is broken, unexpected or unneeded. The server does not care about detached parts and they can be removed. │
│ TotalRowsOfMergeTreeTables              │    2781309 │ Total amount of rows (records) stored in all tables of MergeTree family.                                                                                                                                                                                   │
│ TotalBytesOfMergeTreeTables             │    7741926 │ Total amount of bytes (compressed, including data and indices) stored in all tables of MergeTree family.                                                                                                                                                   │
│ NumberOfTables                          │         93 │ Total number of tables summed across the databases on the server, excluding the databases that cannot contain MergeTree tables. The excluded database engines are those who generate the set of tables on the fly, like `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases                       │          6 │ Total number of databases on the server.                                                                                                                                                                                                                   │
│ MaxPartCountForPartition                │          6 │ Maximum number of parts per partition across all partitions of all tables of MergeTree family. Values larger than 300 indicates misconfiguration, overload, or massive data loading.                                                                       │
│ ReplicasSumMergesInQueue                │          0 │ Sum of merge operations in the queue (still to be applied) across Replicated tables.                                                                                                                                                                       │
│ ReplicasSumInsertsInQueue               │          0 │ Sum of INSERT operations in the queue (still to be replicated) across Replicated tables.                                                                                                                                                                   │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

Descrição das métricas

TempoGastoNoCálculoDeMétricasAssíncronasPesadas

Tempo, em segundos, gasto no cálculo de métricas assíncronas pesadas (relacionadas a tabelas) — esta é a sobrecarga das métricas assíncronas.

AsynchronousHeavyMetricsUpdateInterval

Intervalo de atualização de métricas pesadas relacionadas a tabelas

AsynchronousMetricsCalculationTimeSpent

Tempo em segundos gasto no cálculo das métricas assíncronas (essa é a sobrecarga das métricas assíncronas).

AsynchronousMetricsUpdateInterval

Intervalo de atualização das métricas

BlockActiveTime_name

Tempo, em segundos, durante o qual o dispositivo de bloco teve solicitações de E/S na fila. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Origem: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

Número de bytes descartados no dispositivo de bloco. Essas operações são relevantes para SSDs. As operações de descarte não são usadas pelo ClickHouse, mas podem ser usadas por outros processos no sistema. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

Número de operações de descarte solicitadas ao dispositivo de bloco e agrupadas pelo scheduler de E/S do sistema operacional. Essas operações são relevantes em SSDs. As operações de descarte não são usadas pelo ClickHouse, mas podem ser usadas por outros processos no sistema. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Origem: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

Número de operações de descarte solicitadas no dispositivo de bloco. Essas operações são relevantes para SSDs. As operações de descarte não são usadas pelo ClickHouse, mas podem ser usadas por outros processos no sistema. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

Tempo, em segundos, gasto em operações de descarte solicitadas ao dispositivo de bloco, somado ao longo de todas as operações. Essas operações são relevantes para SSDs. As operações de descarte não são usadas pelo ClickHouse, mas podem ser usadas por outros processos no sistema. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

Este valor conta o número de solicitações de E/S que foram enviadas ao driver do dispositivo, mas ainda não foram concluídas. Ele não inclui solicitações de E/S que estão na fila, mas ainda não foram enviadas ao driver do dispositivo. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

Este valor representa o número de milissegundos em que as solicitações de E/S ficaram esperando neste dispositivo de bloco. Se houver várias solicitações de E/S em espera, este valor aumentará pelo produto do número de milissegundos pelo número de solicitações em espera. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadBytes_name

Número de bytes lidos do dispositivo de bloco. Pode ser menor que o número de bytes lidos do sistema de arquivos devido ao uso do cache de páginas do sistema operacional, que economiza E/S. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

Número de operações de leitura solicitadas ao dispositivo de bloco e agrupadas pelo scheduler de E/S do SO. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

Número de operações de leitura solicitadas ao dispositivo de bloco. Esta é uma métrica do sistema como um todo; inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

Tempo, em segundos, gasto em operações de leitura solicitadas ao dispositivo de bloco, somado em todas as operações. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

Número de bytes gravados no dispositivo de bloco. Esse valor pode ser menor que o número de bytes gravados no sistema de arquivos devido ao uso do cache de páginas do sistema operacional, que economiza E/S. Uma gravação no dispositivo de bloco pode ocorrer depois da gravação correspondente no sistema de arquivos devido ao cache write-through. Esta é uma métrica de todo o sistema: inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

Número de operações de escrita solicitadas ao dispositivo de bloco e mescladas pelo scheduler de E/S do sistema operacional. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina hospedeira, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

Número de operações de escrita solicitadas para o dispositivo de bloco. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Consulte https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

Tempo em segundos gasto em operações de gravação solicitadas ao dispositivo de bloco, somado em todas as operações. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Fonte: /sys/block. Veja https://www.kernel.org/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

A frequência atual da CPU, em MHz. A maioria das CPUs modernas ajusta essa frequência dinamicamente para economizar energia e usar o Turbo Boost.

DictionaryMaxUpdateDelay

O atraso máximo, em segundos, na atualização do dicionário.

DictionaryTotalFailedUpdates

Número de erros desde o último carregamento bem-sucedido de todos os dicionários.

DiskAvailable_name

Bytes disponíveis no disco (sistema de arquivos virtual). Filesystems remotos podem exibir um valor alto, como 16 EiB.

DiskTotal_name

O tamanho total, em bytes, do disco (sistema de arquivos virtual). Sistemas de arquivos remotos podem mostrar um valor alto, como 16 EiB.

DiskUnreserved_name

Bytes disponíveis no disco (sistema de arquivos virtual), sem considerar as reservas para merges, fetches e moves. Sistemas de arquivos remotos podem exibir um valor alto, como 16 EiB.

DiskUsed_name

Bytes usados no disco (sistema de arquivos virtual). Filesystems remotos nem sempre fornecem essa informação.

FilesystemCacheBytes

Total de bytes no sistema de arquivos virtual cache. Esse cache é mantido em disco.

FilesystemCacheFiles

Número total de segmentos de arquivo em cache no sistema de arquivos virtual cache. Esse cache é armazenado em disco.

FilesystemLogsPathAvailableBytes

Bytes disponíveis no volume em que o diretório de logs do ClickHouse está montado. Se esse valor se aproximar de zero, ajuste a rotação de logs no arquivo de configuração.

FilesystemLogsPathAvailableINodes

O número de inodes disponíveis no volume em que o caminho dos logs do ClickHouse está montado.

FilesystemLogsPathTotalBytes

O tamanho do volume em que o diretório de logs do ClickHouse está montado, em bytes. Recomenda-se ter pelo menos 10 GB para os logs.

FilesystemLogsPathTotalINodes

O número total de inodes no volume em que o caminho dos logs do ClickHouse está montado.

FilesystemLogsPathUsedBytes

Bytes em uso no volume em que o caminho dos logs do ClickHouse está montado.

FilesystemLogsPathUsedINodes

O número de inodes em uso no volume em que o caminho dos logs do ClickHouse está montado.

FilesystemMainPathAvailableBytes

Número de bytes disponíveis no volume em que o caminho principal do ClickHouse está montado.

INodesDisponíveisNoCaminhoPrincipalDoFilesystem

O número de inodes disponíveis no volume em que o caminho principal do ClickHouse está montado. Se esse número estiver próximo de zero, isso indica uma configuração incorreta, e você receberá ‘no space left on device’ mesmo que o disco não esteja cheio.

FilesystemMainPathTotalBytes

O tamanho, em bytes, do volume em que o caminho principal do ClickHouse está montado.

Total de inodes no caminho principal do sistema de arquivos

O número total de inodes no volume em que o caminho principal do ClickHouse está montado. Se for menor que 25 milhões, isso indica uma configuração incorreta.

FilesystemMainPathUsedBytes

Bytes em uso no volume em que o caminho principal do ClickHouse está montado.

FilesystemMainPathUsedINodes

O número de inodes em uso no volume em que o caminho principal do ClickHouse está montado. Esse valor, em geral, corresponde ao número de arquivos.

HTTPThreads

Número de threads no servidor da interface HTTP (sem TLS).

HTTPSecureThreads

Número de threads no servidor da interface HTTPS.

InterserverThreads

Número de threads no servidor do protocolo de comunicação entre as réplicas (sem TLS).

InterserverSecureThreads

Número de threads no servidor do protocolo de comunicação das réplicas (com TLS).

Jitter

A diferença entre o momento em que a thread responsável pelo cálculo das métricas assíncronas estava programada para ser ativada e o momento em que ela foi efetivamente ativada. Um indicador indireto da latência geral e da capacidade de resposta do sistema.

LoadAverageN

A carga do sistema como um todo, calculada como uma média com suavização exponencial ao longo de 1 minuto. A carga representa o número de threads em todos os processos (as entidades de escalonamento do kernel do sistema operacional) que estão atualmente em execução na CPU ou aguardando E/S, ou prontas para execução, mas que não estão sendo escalonadas neste momento. Esse número inclui todos os processos, não apenas o clickhouse-server. Esse número pode ser maior que o número de núcleos de CPU se o sistema estiver sobrecarregado e muitos processos estiverem prontos para executar, mas aguardando CPU ou E/S.

MaxPartCountForPartition

Número máximo de partes por partição, considerando todas as partições de todas as tabelas da família MergeTree. Valores acima de 300 indicam configuração incorreta, sobrecarga ou carregamento massivo de dados.

MemoryCode

Quantidade de memória virtual mapeada para as páginas de código de máquina do processo do servidor, em bytes.

MemoryDataAndStack

A quantidade de memória virtual mapeada para uso da pilha e da memória alocada, em bytes. Não está especificado se isso inclui as pilhas por thread e a maior parte da memória alocada com a chamada de sistema ‘mmap’. Essa métrica existe apenas por completude. Recomendo usar a métrica MemoryResident para monitoramento.

MemoryResidentMax

Quantidade máxima de memória física usada pelo processo do servidor, em bytes.

MemoryResident

Quantidade de memória física usada pelo processo do servidor, em bytes.

MemoryShared

A quantidade de memória usada pelo processo do servidor que também é compartilhada com outros processos, em bytes. O ClickHouse não usa memória compartilhada, mas o sistema operacional pode, por seus próprios motivos, classificar parte da memória como compartilhada. Não faz muito sentido acompanhar essa métrica, e ela existe apenas por completude.

MemoryVirtual

O tamanho do espaço de endereçamento virtual alocado pelo processo do servidor, em bytes. O tamanho do espaço de endereçamento virtual geralmente é muito maior do que o consumo de memória física e não deve ser usado como estimativa desse consumo. Valores altos dessa métrica são totalmente normais e só fazem sentido do ponto de vista técnico.

MySQLThreads

Número de threads no servidor do protocolo de compatibilidade com MySQL.

NetworkReceiveBytes_name

Número de bytes recebidos pela interface de rede. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina hospedeira, não apenas o clickhouse-server.

NetworkReceiveDrop_name

Número de bytes de um pacote descartado ao ser recebido pela interface de rede. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

NetworkReceiveErrors_name

Número de vezes que ocorreu um erro ao receber dados pela interface de rede. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

NetworkReceivePackets_name

Número de pacotes de rede recebidos pela interface de rede. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

NetworkSendBytes_name

Número de bytes enviados pela interface de rede. Esta é uma métrica do sistema como um todo; inclui todos os processos na máquina host, não apenas o clickhouse-server.

NetworkSendDrop_name

Número de vezes que um packed foi descartado durante o envio pela interface de rede. Esta é uma métrica do sistema como um todo; ela inclui todos os processos na máquina host, não apenas o clickhouse-server.

NetworkSendErrors_name

Número de vezes que um erro (por exemplo, retransmissão de TCP) ocorreu durante o envio pela interface de rede. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

NetworkSendPackets_name

Número de pacotes de rede enviados pela interface de rede. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

NumberOfDatabases

Número total de bancos de dados no servidor.

NumberOfDetachedByUserParts

O número total de partes desanexadas de tabelas MergeTree por usuários por meio da consulta ALTER TABLE DETACH (em oposição a partes inesperadas, corrompidas ou ignoradas). O servidor não considera as partes desanexadas, e elas podem ser removidas.

NumberOfDetachedParts

O número total de partes desanexadas de tabelas MergeTree. Uma parte pode ser desanexada por um usuário com a consulta ALTER TABLE DETACH ou pelo próprio servidor se a parte estiver corrompida, inesperada ou não for necessária. O servidor ignora as partes desanexadas, e elas podem ser removidas.

NumberOfTables

Número total de tabelas somado em todos os bancos de dados do servidor, excluindo os bancos de dados que não podem conter tabelas MergeTree. Os motores de banco de dados excluídos são aqueles que geram o conjunto de tabelas em tempo real, como Lazy, MySQL, PostgreSQL, SQlite.

OSContextSwitches

O número de trocas de contexto pelas quais o sistema passou na máquina host. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSGuestNiceTime

A proporção do tempo gasto executando uma CPU virtual de sistemas operacionais convidados sob o controle do kernel Linux, quando o convidado foi configurado com prioridade mais alta (consulte man procfs). Esta é uma métrica do sistema como um todo; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Essa métrica é irrelevante para o ClickHouse, mas ainda existe por completude. O valor para um único núcleo de CPU estará no intervalo [0..1]. O valor para todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSGuestNiceTimeCPU_N

A proporção do tempo gasto na execução de uma CPU virtual para sistemas operacionais convidados sob o controle do kernel Linux, quando um convidado foi configurado com prioridade mais alta (consulte man procfs). Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Essa métrica é irrelevante para o ClickHouse, mas ainda existe por completude. O valor de um único núcleo de CPU estará no intervalo [0..1]. O valor de todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSGuestNiceTimeNormalized

O valor é semelhante a OSGuestNiceTime, mas é dividido pelo número de núcleos de CPU para ser expresso no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificada, a cota de CPU do Cgroup dividida pelo respectivo período pode ser usada em vez do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode exceder 1 em determinados momentos.

OSGuestTime

A proporção do tempo gasto executando uma CPU virtual para sistemas operacionais convidados sob o controle do kernel Linux (consulte man procfs). Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Essa métrica é irrelevante para o ClickHouse, mas ainda existe por completude. O valor para um único núcleo de CPU estará no intervalo [0..1]. O valor para todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSGuestTimeCPU_N

A proporção do tempo gasto executando uma CPU virtual para sistemas operacionais convidados sob o controle do kernel Linux (consulte man procfs). Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Esta métrica é irrelevante para o ClickHouse, mas ainda existe para fins de completude. O valor de um único núcleo de CPU estará no intervalo [0..1]. O valor de todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSGuestTimeNormalized

O valor é semelhante a OSGuestTime, mas é dividido pelo número de núcleos de CPU para ser medido no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificado, a Cgroup CPU quota dividida pelo respectivo período pode ser usada em vez do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode ultrapassar 1 em determinados momentos.

OSIOWaitTime

A proporção de tempo em que o núcleo da CPU não estava executando código, mas em que o kernel do SO também não executava nenhum outro processo nessa CPU, porque os processos estavam aguardando por E/S. Esta é uma métrica de todo o sistema; ela inclui todos os processos da máquina host, não apenas o clickhouse-server. O valor de um único núcleo da CPU ficará no intervalo [0..1]. O valor de todos os núcleos da CPU é calculado como a soma entre eles [0..num cores].

OSIOWaitTimeCPU_N

A proporção de tempo em que o núcleo da CPU não estava executando código, enquanto o kernel do SO não executava nenhum outro processo nessa CPU porque os processos estavam aguardando E/S. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. O valor para um único núcleo da CPU estará no intervalo [0..1]. O valor para todos os núcleos da CPU é calculado como a soma de todos eles [0..num cores].

OSIOWaitTimeNormalized

O valor é semelhante a OSIOWaitTime, mas é dividido pelo número de núcleos de CPU para ficar no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificado, a quota de CPU do Cgroup dividida pelo respectivo período pode ser usada em vez do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode ultrapassar 1 em determinados momentos.

OSIdleTime

A proporção do tempo em que o núcleo da CPU ficou ocioso (nem sequer pronto para executar um processo aguardando E/S), do ponto de vista do kernel do sistema operacional. Esta é uma métrica do sistema como um todo; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Isso não inclui o tempo em que a CPU foi subutilizada por motivos internos à própria CPU (carregamentos de memória, paradas no pipeline, previsões incorretas de desvios, execução de outro núcleo SMT). O valor para um único núcleo da CPU estará no intervalo [0..1]. O valor para todos os núcleos da CPU é calculado como a soma de todos eles [0..num cores].

OSIdleTimeCPU_N

A proporção de tempo em que o núcleo da CPU ficou ocioso (sem estar sequer pronto para executar um processo aguardando E/S), do ponto de vista do kernel do sistema operacional. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Isso não inclui o tempo em que a CPU ficou subutilizada por motivos internos à própria CPU (cargas de memória, paralisações do pipeline, previsões incorretas de branch, execução de outro núcleo SMT). O valor de um único núcleo da CPU estará no intervalo [0..1]. O valor de todos os núcleos da CPU é calculado como a soma entre eles [0..num cores].

OSIdleTimeNormalized

O valor é semelhante a OSIdleTime, mas é dividido pelo número de núcleos de CPU para ser expresso no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificado, a quota de CPU do Cgroup dividida por seu período pode ser usada no lugar do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode ultrapassar 1 em alguns momentos.

Interrupções do SO

O número de interrupções na máquina host. Esta é uma métrica de todo o sistema; inclui todos os processos da máquina host, não apenas o clickhouse-server.

OSIrqTime

A proporção do tempo gasto na execução de requisições de interrupção de hardware na CPU. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Um valor alto dessa métrica pode indicar uma configuração incorreta de hardware ou uma carga de rede muito alta. O valor para um único núcleo de CPU estará no intervalo [0..1]. O valor para todos os núcleos de CPU é calculado como a soma de todos eles [0..num cores].

OSIrqTimeCPU_N

A proporção do tempo gasto processando requisições de interrupção de hardware na CPU. Esta é uma métrica do sistema como um todo; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Um valor alto dessa métrica pode indicar má configuração de hardware ou uma carga de rede muito alta. O valor para um único núcleo de CPU estará no intervalo [0..1]. O valor para todos os núcleos de CPU é calculado como a soma de todos eles [0..num cores].

OSIrqTimeNormalized

O valor é semelhante a OSIrqTime, mas é dividido pelo número de núcleos de CPU para que fique no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter o valor médio da métrica de utilização de recursos. Se especificado, a quota de CPU do Cgroup dividida pelo seu período pode ser usada no lugar do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode exceder 1 em alguns momentos.

Memória disponível do SO

A quantidade de memória disponível para uso por programas, em bytes. É muito semelhante à métrica OSMemoryFreePlusCached. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSMemoryBuffers

A quantidade de memória usada pelos buffers do kernel do SO, em bytes. Esse valor normalmente deve ser baixo, e valores altos podem indicar uma configuração incorreta do SO. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSMemoryCached

A quantidade de memória usada pelo cache de páginas do sistema operacional, em bytes. Normalmente, quase toda a memória disponível é usada pelo cache de páginas do sistema operacional — valores altos dessa métrica são normais e esperados. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSMemoryFreePlusCached

A quantidade de memória livre somada à memória do cache de páginas do SO no sistema host, em bytes. Essa memória está disponível para uso pelos programas. O valor deve ser muito semelhante a OSMemoryAvailable. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSMemoryFreeWithoutCached

A quantidade de memória livre no sistema do host, em bytes. Isso não inclui a memória usada pelo cache de páginas do SO, em bytes. A memória do cache de páginas também está disponível para uso pelos programas, portanto o valor dessa métrica pode ser confuso. Em vez disso, consulte a métrica OSMemoryAvailable. Por conveniência, também fornecemos a métrica OSMemoryFreePlusCached, que deve ser relativamente semelhante a OSMemoryAvailable. Veja também https://www.linuxatemyram.com/. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSMemoryTotal

A quantidade total de memória no sistema hospedeiro, em bytes.

OSNiceTime

A proporção de tempo em que o núcleo da CPU estava executando código em espaço de usuário com prioridade mais alta. Esta é uma métrica de todo o sistema e inclui todos os processos na máquina host, não apenas o clickhouse-server. O valor de um único núcleo da CPU estará no intervalo [0..1]. O valor de todos os núcleos da CPU é calculado como a soma entre eles [0..num cores].

OSNiceTimeCPU_N

A proporção de tempo em que o núcleo da CPU estava executando código em espaço de usuário com prioridade mais alta. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. O valor de um único núcleo da CPU estará no intervalo [0..1]. O valor de todos os núcleos da CPU é calculado como a soma de todos eles [0..num cores].

OSTempoNiceNormalizado

O valor é semelhante a OSNiceTime, mas é dividido pelo número de núcleos de CPU para ser medido no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificada, a quota de CPU do Cgroup dividida pelo seu período pode ser usada no lugar do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode exceder 1 em determinados momentos.

OSOpenFiles

O número total de arquivos abertos na máquina host. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSProcessesBlocked

Número de threads bloqueadas, aguardando a conclusão de operações de E/S (man procfs). Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSProcessesCreated

O número de processos criados. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSProcessesRunning

O número de threads aptas a executar (em execução ou prontas para executar) no sistema operacional. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server.

OSSoftIrqTime

A proporção do tempo gasto na execução de solicitações de interrupção de software na CPU. Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. Um valor alto dessa métrica pode indicar a execução de software ineficiente no sistema. O valor de um único núcleo de CPU estará no intervalo [0..1]. O valor de todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSSoftIrqTimeCPU_N

A proporção do tempo gasto na execução de solicitações de interrupção de software na CPU. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Um valor alto dessa métrica pode indicar a execução de software ineficiente no sistema. O valor para um único núcleo de CPU estará no intervalo [0..1]. O valor para todos os núcleos de CPU é calculado como a soma de todos eles [0..num cores].

OSSoftIrqTimeNormalized

O valor é semelhante a OSSoftIrqTime, mas é dividido pelo número de núcleos de CPU, para que seja medido no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos varie, e ainda assim obter a métrica média de utilização de recursos. Se especificada, a quota de CPU do Cgroup dividida por seu período pode ser usada em vez do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode exceder 1 em determinados momentos.

OSStealTime

A proporção do tempo que a CPU passa executando outros sistemas operacionais em um ambiente virtualizado. Esta é uma métrica de todo o sistema e inclui todos os processos da máquina host, não apenas o clickhouse-server. Nem todos os ambientes virtualizados apresentam essa métrica, e a maioria não apresenta. O valor de um único núcleo de CPU estará no intervalo [0..1]. O valor de todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSStealTimeCPU_N

A proporção do tempo em que a CPU fica ocupada por outros sistemas operacionais ao executar em um ambiente virtualizado. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Nem todos os ambientes virtualizados fornecem essa métrica, e a maioria não fornece. O valor para um único núcleo de CPU estará no intervalo [0..1]. O valor para todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSStealTimeNormalized

O valor é semelhante a OSStealTime, mas é dividido pelo número de núcleos de CPU para ser expresso no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica entre vários servidores em um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificado, a quota de CPU do Cgroup dividida pelo respectivo período pode ser usada em vez do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode exceder 1 em determinados momentos.

OSSystemTime

A proporção do tempo em que o núcleo da CPU estava executando código do kernel do sistema operacional (system). Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. O valor de um único núcleo da CPU estará no intervalo [0..1]. O valor de todos os núcleos da CPU é calculado como a soma entre eles [0..num cores].

OSSystemTimeCPU_N

A proporção do tempo em que o núcleo da CPU esteve executando código do kernel do sistema operacional (system). Esta é uma métrica de todo o sistema; inclui todos os processos na máquina host, não apenas o clickhouse-server. O valor de um único núcleo de CPU estará no intervalo [0..1]. O valor de todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSSystemTimeNormalized

O valor é semelhante a OSSystemTime, mas é dividido pelo número de núcleos de CPU para ser medido no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificada, a quota de CPU do Cgroup dividida pelo respectivo período pode ser usada em vez do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode ultrapassar 1 em determinados momentos.

OSThreadsRunnable

O número total de threads “prontas para execução”, conforme visto pelo scheduler do kernel do sistema operacional.

OSThreadsTotal

O número total de threads, segundo o scheduler do kernel do SO.

OSUptime

O tempo de atividade do servidor host (a máquina em que o ClickHouse está sendo executado), em segundos.

OSUserTime

A proporção de tempo em que o núcleo da CPU estava executando código em espaço de usuário. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Isso também inclui o tempo em que a CPU ficou subutilizada por motivos internos à própria CPU (carregamentos de memória, stalls de pipeline, previsões incorretas de desvio, execução de outro núcleo SMT). O valor de um único núcleo de CPU estará no intervalo [0..1]. O valor de todos os núcleos de CPU é calculado como a soma entre eles [0..num cores].

OSUserTimeCPU_N

A proporção do tempo em que o núcleo da CPU executou código em espaço de usuário. Esta é uma métrica de todo o sistema; ela inclui todos os processos na máquina host, não apenas o clickhouse-server. Isso também inclui o tempo em que a CPU ficou subutilizada devido a razões internas da própria CPU (carregamentos de memória, stalls de pipeline, erros de predição de desvios, execução de outro núcleo SMT). O valor para um único núcleo da CPU estará no intervalo [0..1]. O valor para todos os núcleos da CPU é calculado como a soma de todos eles [0..num cores].

OSUserTimeNormalized

O valor é semelhante a OSUserTime, mas é dividido pelo número de núcleos de CPU para que seja medido no intervalo [0..1], independentemente da quantidade de núcleos. Isso permite calcular a média dos valores dessa métrica em vários servidores de um cluster, mesmo que o número de núcleos não seja uniforme, e ainda assim obter a métrica média de utilização de recursos. Se especificada, a quota de CPU do cgroup dividida pelo respectivo período pode ser usada no lugar do número real de núcleos de CPU e, nesse caso, o valor dessa métrica pode ultrapassar 1 em alguns momentos.

PostgreSQLThreads

Número de threads no servidor do protocolo de compatibilidade com PostgreSQL.

QueriesMemoryUsage

Memória total usada no momento por todas as consultas em execução no servidor, em bytes. Útil para atribuir a pressão sobre a memória à carga de consultas concorrentes.

QueriesPeakMemoryUsage

Soma dos picos de memória de consulta por usuário de todos os usuários rastreados em ProcessList, em bytes. O pico de cada usuário é a marca d’água máxima do memory tracker desse usuário, que é redefinido quando o usuário não tem consultas em execução. Portanto, este é um agregado dos picos por usuário atualmente rastreados, e não um único pico de todo o servidor para todas as consultas desde a inicialização.

ReplicasMaxAbsoluteDelay

Diferença máxima, em segundos, entre a parte replicada mais recente e a parte de dados mais recente que ainda precisa ser replicada, nas tabelas Replicated. Um valor muito alto indica uma réplica sem dados.

ReplicasMaxInsertsInQueue

Número máximo de operações de INSERT na fila (ainda pendentes de replicação) em tabelas Replicated.

ReplicasMaxMergesInQueue

Número máximo de operações de merge na fila (ainda pendentes de aplicação) em tabelas Replicated.

ReplicasMaxQueueSize

Tamanho máximo da fila (em número de operações, como get e merge) nas tabelas Replicated.

ReplicasMaxRelativeDelay

Diferença máxima entre o atraso de uma réplica e o da réplica mais atualizada da mesma tabela, nas tabelas Replicated.

ReplicasSumInsertsInQueue

Soma das operações de INSERT na fila (ainda pendentes de replicação) nas tabelas Replicated.

ReplicasSumMergesInQueue

Soma das operações de merge na fila (ainda pendentes de aplicação) nas tabelas Replicated.

ReplicasSumQueueSize

Soma do tamanho da fila (em número de operações, como get e merge) em tabelas Replicated.

TCPThreads

Número de threads do servidor do protocolo TCP (sem TLS).

TCPSecureThreads

Número de threads do servidor do protocolo TCP (com TLS).

GRPCThreads

Número de threads do servidor do protocolo GRPC.

PrometheusThreads

Número de threads no servidor do endpoint do Prometheus. Observação: endpoints do Prometheus também podem ser usados por meio das portas HTTP/HTTPS usuais.

KeeperTCPThreads

Número de threads no servidor do protocolo TCP do Keeper (sem TLS).

KeeperTCPSecureThreads

Número de threads no servidor do protocolo TCP do Keeper (com TLS).

Temperatura_N

A temperatura do dispositivo correspondente em ℃. Um sensor pode retornar um valor fora da realidade. Fonte: /sys/class/thermal

Temperatura_name

A temperatura, em ℃, informada pelo monitor de hardware e pelo sensor correspondentes. Um sensor pode retornar um valor irrealista. Fonte: /sys/class/hwmon

TotalBytesOfMergeTreeTables

Quantidade total de bytes (comprimidos, incluindo dados e índices) armazenados em todas as tabelas da família MergeTree.

TotalPartsOfMergeTreeTables

Quantidade total de partes de dados em todas as tabelas da família MergeTree. Valores acima de 10 000 afetarão negativamente o tempo de inicialização do servidor e podem indicar uma escolha inadequada da chave de partição.

TotalPrimaryKeyBytesInMemory

A quantidade total de memória (em bytes) usada pelos valores da chave primária (considera apenas as partes ativas).

TotalPrimaryKeyBytesInMemoryAllocated

O total de memória (em bytes) reservada para os valores da chave primária (leva em conta apenas as partes ativas).

TotalRowsOfMergeTreeTables

Quantidade total de linhas (registros) armazenadas em todas as tabelas da família MergeTree.

Tempo de atividade

O tempo de atividade do servidor em segundos. Inclui o tempo gasto na inicialização do servidor antes de aceitar conexões.

ZooKeeperClientLastZXIDSeen

O último ZXID observado pela sessão atual do cliente ZooKeeper. Esse valor aumenta monotonicamente à medida que o cliente observa transações do ZooKeeper.

LongestRunningMerge

Tempo decorrido, em segundos, do merge em segundo plano que está em execução há mais tempo no momento.

jemalloc.active

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

Um número interno de atualização incremental das estatísticas do jemalloc (o alocador de memória de Jason Evans), usado em todas as outras métricas de jemalloc.

jemalloc.mapped

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.resident

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.retained

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

Uma métrica interna do alocador de memória de baixo nível (jemalloc). Consulte https://jemalloc.net/jemalloc.3.html Veja também
  • Monitoramento — Conceitos básicos de monitoramento do ClickHouse.
  • system.metrics — Contém métricas calculadas instantaneamente.
  • system.events — Contém diversos eventos que ocorreram.
  • system.metric_log — Contém um histórico dos valores das métricas das tabelas system.metrics e system.events.
Última modificação em 10 de junho de 2026