ダッシュボード
サービスの健全性
リソース使用状況
メモリと CPU
パフォーマンスの低下メモリまたは CPU の使用率が割り当て済みのメモリまたは CPU に近づくと、パフォーマンスが低下し始める可能性があります。対処方法として、以下を推奨します。
- クエリを最適化する
- テーブルエンジンのパーティション化を変更する
- オートスケーリングを使用して、サービスにより多くのコンピュートリソースを追加する
| グラフ | 対応するメトリクス名 | 集計 | 注記 |
|---|---|---|---|
| 割り当て済みメモリ | CGroupMemoryTotal | 最大 | |
| 割り当て済み CPU | CGroupMaxCPU | 最大 | |
| 使用メモリ | MemoryResident | 最大 | |
| 使用 CPU | System CPU metric | 最大 | Prometheus エンドポイント経由の ClickHouseServer_UsageCores |
データ転送
高度なダッシュボード
ClickHouse Cloud は、このダッシュボードに表示されるメトリクスをシステムテーブルからスクレイプして保存しているため、サービスがアイドル状態でも表示できます。これらのメトリクスにアクセスしても、基盤となるサービスに対してクエリは発行されず、アイドル状態のサービスが起動することもありません。
| グラフ | 対応する ClickHouse メトリクス名 | システムテーブル | 集計タイプ |
|---|---|---|---|
| クエリ/秒 | ProfileEvent_Query | metric_log | Sum / bucketSizeSeconds |
| 実行中のクエリ | CurrentMetric_Query | metric_log | Avg |
| 実行中のマージ | CurrentMetric_Merge | metric_log | Avg |
| 読み取りバイト数/秒 | ProfileEvent_SelectedBytes | metric_log | Sum / bucketSizeSeconds |
| IO 待機 | ProfileEvent_OSIOWaitMicroseconds | metric_log | Sum / bucketSizeSeconds |
| S3 読み取り待機 | ProfileEvent_ReadBufferFromS3Microseconds | metric_log | Sum / bucketSizeSeconds |
| S3 読み取りエラー/秒 | ProfileEvent_ReadBufferFromS3RequestsErrors | metric_log | Sum / bucketSizeSeconds |
| CPU 待機 | ProfileEvent_OSCPUWaitMicroseconds | metric_log | Sum / bucketSizeSeconds |
| OS CPU 使用率 (ユーザー空間、正規化済み) | OSUserTimeNormalized | asynchronous_metric_log | |
| OS CPU 使用率 (カーネル、正規化済み) | OSSystemTimeNormalized | asynchronous_metric_log | |
| ディスクからの読み取り | ProfileEvent_OSReadBytes | metric_log | Sum / bucketSizeSeconds |
| ファイルシステムからの読み取り | ProfileEvent_OSReadChars | metric_log | Sum / bucketSizeSeconds |
| メモリ (追跡対象、バイト) | CurrentMetric_MemoryTracking | metric_log | |
| MergeTree パーツ総数 | TotalPartsOfMergeTreeTables | asynchronous_metric_log | |
| パーティションあたりの最大パーツ数 | MaxPartCountForPartition | asynchronous_metric_log | |
| S3 からの読み取り | ProfileEvent_ReadBufferFromS3Bytes | metric_log | Sum / bucketSizeSeconds |
| ファイルシステムキャッシュサイズ | CurrentMetric_FilesystemCacheSize | metric_log | |
| Disk S3 書き込みリクエスト/秒 | ProfileEvent_DiskS3PutObject + ProfileEvent_DiskS3UploadPart + ProfileEvent_DiskS3CreateMultipartUpload + ProfileEvent_DiskS3CompleteMultipartUpload | metric_log | Sum / bucketSizeSeconds |
| Disk S3 読み取りリクエスト/秒 | ProfileEvent_DiskS3GetObject + ProfileEvent_DiskS3HeadObject + ProfileEvent_DiskS3ListObjects | metric_log | Sum / bucketSizeSeconds |
| FS cache ヒット率 | sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) / (sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) + sum(ProfileEvent_CachedReadBufferReadFromSourceBytes)) | metric_log | |
| Page cache ヒット率 | greatest(0, (sum(ProfileEvent_OSReadChars) - sum(ProfileEvent_OSReadBytes)) / (sum(ProfileEvent_OSReadChars) + sum(ProfileEvent_ReadBufferFromS3Bytes))) | metric_log | |
| ネットワーク受信バイト数/秒 | NetworkReceiveBytes | asynchronous_metric_log | Sum / bucketSizeSeconds |
| ネットワーク送信バイト数/秒 | NetworkSendBytes | asynchronous_metric_log | Sum / bucketSizeSeconds |
| 同時 TCP 接続数 | CurrentMetric_TCPConnection | metric_log | |
| 同時 MySQL 接続数 | CurrentMetric_MySQLConnection | metric_log | |
| 同時 HTTP 接続数 | CurrentMetric_HTTPConnection | metric_log |
クエリインサイト
system.query_log テーブルは、クエリ最適化、デバッグ、そしてクラスター全体の健全性とパフォーマンスの監視における重要な情報源です。
サービスを選択すると、左側のサイドバーにある 監視 ナビゲーション項目が展開され、クエリインサイト サブ項目が表示されます。
上部のメトリクス
最近のクエリ
クエリのドリルダウン
Settings 項目と Profile Events 項目を展開して、追加情報を確認できます。
- Notifications — スケーリングイベント、エラー、請求に関するアラートを設定します
- 高度なダッシュボード — 各ダッシュボードの可視化についての詳細なリファレンス
- システムテーブルのクエリ — 詳細な内部診断のために、システムテーブルに対してカスタム SQL クエリを実行します
- Prometheus エンドポイント — メトリクスを Grafana、Datadog、その他の Prometheus 互換ツールにエクスポートします