跳转到主要内容

ClickStack 中的生存时间 (TTL)

生存时间 (TTL) 是 ClickStack 中一项关键功能,可用于高效地保留和管理数据,尤其适用于持续产生海量数据的场景。生存时间 (TTL) 可以让较旧的数据自动过期并删除,从而确保存储资源得到最佳利用,并在无需人工干预的情况下保持系统性能。这项能力对于精简数据库、降低存储成本,以及通过聚焦最新且最相关的数据来保证查询始终快速高效都至关重要。此外,它还可通过系统化地管理数据生命周期,帮助满足数据保留策略的合规要求,从而提升整个可观测性解决方案的可持续性和可扩展性。 默认情况下,ClickStack 会将数据保留 3 天。要修改此设置,请参见”修改生存时间 (TTL)” 在 ClickHouse 中,生存时间 (TTL) 按表级别控制。例如,日志的 schema 如下所示:
CREATE TABLE default.otel_logs
(
    `Timestamp` DateTime64(9) CODEC(Delta(8), ZSTD(1)),
    `TimestampTime` DateTime DEFAULT toDateTime(Timestamp),
    `TraceId` String CODEC(ZSTD(1)),
    `SpanId` String CODEC(ZSTD(1)),
    `TraceFlags` UInt8,
    `SeverityText` LowCardinality(String) CODEC(ZSTD(1)),
    `SeverityNumber` UInt8,
    `ServiceName` LowCardinality(String) CODEC(ZSTD(1)),
    `Body` String CODEC(ZSTD(1)),
    `ResourceSchemaUrl` LowCardinality(String) CODEC(ZSTD(1)),
    `ResourceAttributes` Map(LowCardinality(String), String) CODEC(ZSTD(1)),
    `ScopeSchemaUrl` LowCardinality(String) CODEC(ZSTD(1)),
    `ScopeName` String CODEC(ZSTD(1)),
    `ScopeVersion` LowCardinality(String) CODEC(ZSTD(1)),
    `ScopeAttributes` Map(LowCardinality(String), String) CODEC(ZSTD(1)),
    `LogAttributes` Map(LowCardinality(String), String) CODEC(ZSTD(1)),
    INDEX idx_trace_id TraceId TYPE bloom_filter(0.001) GRANULARITY 1,
    INDEX idx_res_attr_key mapKeys(ResourceAttributes) TYPE bloom_filter(0.01) GRANULARITY 1,
    INDEX idx_res_attr_value mapValues(ResourceAttributes) TYPE bloom_filter(0.01) GRANULARITY 1,
    INDEX idx_scope_attr_key mapKeys(ScopeAttributes) TYPE bloom_filter(0.01) GRANULARITY 1,
    INDEX idx_scope_attr_value mapValues(ScopeAttributes) TYPE bloom_filter(0.01) GRANULARITY 1,
    INDEX idx_log_attr_key mapKeys(LogAttributes) TYPE bloom_filter(0.01) GRANULARITY 1,
    INDEX idx_log_attr_value mapValues(LogAttributes) TYPE bloom_filter(0.01) GRANULARITY 1,
    INDEX idx_body Body TYPE tokenbf_v1(32768, 3, 0) GRANULARITY 8
)
ENGINE = MergeTree
PARTITION BY toDate(TimestampTime)
PRIMARY KEY (ServiceName, TimestampTime)
ORDER BY (ServiceName, TimestampTime, Timestamp)
TTL TimestampTime + toIntervalDay(3)
SETTINGS ttl_only_drop_parts = 1
ClickHouse 中的分区可根据某个列或 SQL 表达式,在磁盘上对数据进行逻辑划分。通过这种逻辑分离方式,每个分区都可以独立操作,例如在根据生存时间 (TTL) 策略到期时将其删除。 如上例所示,分区是在表初次定义时通过 PARTITION BY 子句指定的。该子句可以包含基于任意列的 SQL 表达式,其结果将决定某一行会被写入哪个分区。这样一来,磁盘上的数据就会通过共同的文件夹名称前缀与各个分区建立逻辑关联,从而可以单独查询某个分区。以上述示例为例,默认的 otel_logs schema 使用表达式 toDate(Timestamp). 按天分区。当行被插入 ClickHouse 时,系统会针对每一行计算该表达式,并将其路由到相应的分区;如果该分区尚不存在 (即这是某一天的第一行数据) ,则会创建该分区。有关分区及其其他用途的更多信息,请参阅”表分区” 表的 schema 还包含 TTL TimestampTime + toIntervalDay(3) 以及设置 ttl_only_drop_parts = 1。前一个子句可确保数据在超过 3 天后被删除。设置 ttl_only_drop_parts = 1 会强制仅在整个数据分区片段中的数据都已过期时才删除该数据分区片段 (而不是尝试部分删除行) 。由于分区可确保不同日期的数据永远不会被“merged”,因此可以高效地删除数据。
ttl_only_drop_parts我们建议始终使用设置 ttl_only_drop_parts=1。启用此设置后,当某个 part 中的所有行都已过期时,ClickHouse 会直接删除整个 part。删除整个 part,而不是对生存时间 (TTL) 过期的行做部分清理 (在 ttl_only_drop_parts=0 时,这需要通过资源密集型的 mutations 来实现) ,可以将 merge_with_ttl_timeout 设置得更短,并降低对系统性能的影响。如果数据按执行生存时间 (TTL) 过期处理时所用的相同单位进行分区,例如按天分区,那么 parts 自然只会包含该时间间隔内的数据。这将确保 ttl_only_drop_parts=1 能够被高效应用。
默认情况下,生存时间 (TTL) 已过期的数据会在 ClickHouse 合并数据分区片段 时被移除。当 ClickHouse 检测到数据已过期时,它会执行一次计划外合并。
生存时间 (TTL) 调度如上所述,生存时间 (TTL) 不会立即生效,而是按计划执行。MergeTree 表设置 merge_with_ttl_timeout 用于设置再次执行带删除生存时间 (TTL) 的合并前的最小延迟秒数。默认值为 14400 秒 (4 小时) 。但这只是最小延迟;生存时间 (TTL) 合并实际触发前,可能还需要更长时间。如果该值过低,系统会执行大量计划外合并,可能消耗大量资源。可以使用命令 ALTER TABLE my_table MATERIALIZE TTL 强制触发一次生存时间 (TTL) 过期处理。

修改生存时间 (TTL)

要修改生存时间 (TTL),可以采用以下任一方式:
  1. 修改表的 schema (推荐) 。这需要连接到 ClickHouse 实例,例如使用 clickhouse-clientCloud SQL 控制台。例如,可以使用以下 DDL 修改 otel_logs 表的生存时间 (TTL):
ALTER TABLE default.otel_logs
MODIFY TTL TimestampTime + toIntervalDay(7);
  1. 修改 OTel collector。ClickStack OpenTelemetry collector 会在 ClickHouse 中自动创建不存在的表。这是通过 ClickHouse exporter 实现的;该组件提供了一个 ttl 参数,用于控制默认的生存时间 (TTL) 表达式,例如
exporters:
 clickhouse:
   endpoint: tcp://localhost:9000?dial_timeout=10s&compress=lz4&async_insert=1
   ttl: 72h

列级生存时间 (TTL)

上述示例是在表级别让数据过期。你也可以在列级别让数据过期。随着数据逐渐变旧,可以删除那些在调查中的作用不足以抵消其保留成本的列。例如,我们建议保留 Body 列,以防后续新增了尚未在写入时提取的动态元数据,例如新的 Kubernetes 标签。经过一段时间 (例如 1 个月) 后,可能就会明显看出,这些额外元数据并没有实际用处——因此继续保留 Body 列的价值也就有限了。 下面我们展示如何在 30 天后删除 Body 列。
CREATE TABLE otel_logs_v2
(
        `Body` String TTL Timestamp + INTERVAL 30 DAY,
        `Timestamp` DateTime,
 ...
)
ENGINE = MergeTree
ORDER BY (ServiceName, Timestamp)
指定列级生存时间 (TTL) 需要用户自行定义 schema,无法在 OTel collector 中指定。
最后修改于 2026年6月10日