Перейти к основному содержанию

Описание

Комбинатор State можно применить к функции avg, чтобы получить промежуточное состояние типа AggregateFunction(avg, T), где T — указанный тип значения, для которого вычисляется среднее.

Пример использования

В этом примере рассмотрим, как использовать тип AggregateFunction вместе с функцией avgState для агрегации данных о трафике веб-сайта. Сначала создайте исходную таблицу для данных о трафике веб-сайта:
CREATE TABLE raw_page_views
(
    page_id UInt32,
    page_name String,
    response_time_ms UInt32,  -- Время ответа страницы в миллисекундах
    viewed_at DateTime DEFAULT now()
)
ENGINE = MergeTree()
ORDER BY (page_id, viewed_at);
Создайте агрегирующую таблицу для хранения средних значений времени отклика. Обратите внимание, что avg не может использовать тип SimpleAggregateFunction, так как требует сложного состояния (суммы и счётчика). Поэтому используем тип AggregateFunction:
CREATE TABLE page_performance
(
    page_id UInt32,
    page_name String,
    avg_response_time AggregateFunction(avg, UInt32)  -- Хранит состояние, необходимое для вычисления avg
)
ENGINE = AggregatingMergeTree()
ORDER BY page_id;
Создайте incremental materialized view, который будет выступать в роли триггера вставки для новых данных и сохранять промежуточные данные состояния в целевой таблице, определённой выше:
CREATE MATERIALIZED VIEW page_performance_mv
TO page_performance
AS SELECT
    page_id,
    page_name,
    avgState(response_time_ms) AS avg_response_time  -- Использование комбинатора -State
FROM raw_page_views
GROUP BY page_id, page_name;
Вставьте начальные данные в исходную таблицу, создав кусок на диске:
INSERT INTO raw_page_views (page_id, page_name, response_time_ms) VALUES
    (1, 'Homepage', 120),
    (1, 'Homepage', 135),
    (2, 'Products', 95),
    (2, 'Products', 105),
    (3, 'About', 80),
    (3, 'About', 90);
Вставьте ещё немного данных, чтобы создать вторую часть на диске:
INSERT INTO raw_page_views (page_id, page_name, response_time_ms) VALUES
(1, 'Homepage', 150),
(2, 'Products', 110),
(3, 'About', 70),
(4, 'Contact', 60),
(4, 'Contact', 65);
Изучите целевую таблицу page_performance:
SELECT 
    page_id,
    page_name,
    avg_response_time,
    toTypeName(avg_response_time)
FROM page_performance
┌─page_id─┬─page_name─┬─avg_response_time─┬─toTypeName(avg_response_time)──┐
│       1 │ Homepage  │ �                 │ AggregateFunction(avg, UInt32) │
│       2 │ Products  │ �                 │ AggregateFunction(avg, UInt32) │
│       3 │ About     │ �                 │ AggregateFunction(avg, UInt32) │
│       1 │ Homepage  │ �                 │ AggregateFunction(avg, UInt32) │
│       2 │ Products  │ n                 │ AggregateFunction(avg, UInt32) │
│       3 │ About     │ F                 │ AggregateFunction(avg, UInt32) │
│       4 │ Contact   │ }                 │ AggregateFunction(avg, UInt32) │
└─────────┴───────────┴───────────────────┴────────────────────────────────┘
Обратите внимание, что столбец avg_response_time имеет тип AggregateFunction(avg, UInt32) и хранит промежуточные данные состояния. Также обратите внимание, что данные строки для avg_response_time не несут полезной информации — вместо них отображаются странные символы, например �, n, F, }. Это попытка терминала отобразить бинарные данные в виде текста. Причина в том, что типы AggregateFunction хранят своё состояние в бинарном формате, оптимизированном для эффективного хранения и вычислений, а не для восприятия человеком. Это бинарное состояние содержит всю информацию, необходимую для вычисления среднего значения. Чтобы воспользоваться им, используйте комбинатор Merge:
SELECT
    page_id,
    page_name,
    avgMerge(avg_response_time) AS average_response_time_ms
FROM page_performance
GROUP BY page_id, page_name
ORDER BY page_id;
Теперь мы видим корректные средние значения:
┌─page_id─┬─page_name─┬─average_response_time_ms─┐
│       1 │ Homepage  │                      135 │
│       2 │ Products  │       103.33333333333333 │
│       3 │ About     │                       80 │
│       4 │ Contact   │                     62.5 │
└─────────┴───────────┴──────────────────────────┘

См. также

Последнее изменение 10 июня 2026 г.