跳转到主要内容
SELECT 查询用于检索数据。默认情况下,查询请求的数据会返回给客户端;而与 INSERT INTO 结合使用时,也可以将其发送到另一张表。

语法

[WITH expr_list(subquery)]
SELECT [DISTINCT [ON (column1, column2, ...)]] expr_list
[FROM [db.]table | (subquery) | table_function] [FINAL]
[SAMPLE sample_coeff]
[ARRAY JOIN ...]
[GLOBAL] [ANY|ALL|ASOF] [INNER|LEFT|RIGHT|FULL|CROSS] [OUTER|SEMI|ANTI] JOIN (subquery)|table [(alias1 [, alias2 ...])] (ON <expr_list>)|(USING <column_list>)
[PREWHERE expr]
[WHERE expr]
[GROUP BY expr_list] [WITH ROLLUP|WITH CUBE] [WITH TOTALS]
[HAVING expr]
[WINDOW window_expr_list]
[QUALIFY expr]
[ORDER BY expr_list] [WITH FILL] [FROM expr] [TO expr] [STEP expr] [INTERPOLATE [(expr_list)]]
[LIMIT [offset_value, ]n BY columns]
[LIMIT [n, ]m] [WITH TIES]
[SETTINGS ...]
[UNION  ...]
[INTO OUTFILE filename [TRUNCATE] [COMPRESSION type [LEVEL level]] ]
[FORMAT format]
除紧跟在 SELECT 后面的必需表达式列表外,所有子句都是可选的;关于这部分的更详细说明,请参见下文 各可选子句的具体说明分别见单独章节,下面按其执行顺序列出:

SELECT 子句

SELECT 子句中指定的表达式会在上文所述各子句中的所有操作完成后再进行计算。这些表达式会被视为分别作用于结果中的各行。如果 SELECT 子句中的表达式包含聚合函数,那么 ClickHouse 会在 GROUP BY 聚合期间处理这些聚合函数以及作为其参数使用的表达式。 如果你希望结果中包含所有列,请使用星号 (*) 。例如,SELECT * FROM ...

Dynamic 列选择

Dynamic 列选择 (也称为 COLUMNS 表达式) 允许你使用 re2 正则表达式匹配结果中的某些列。
COLUMNS('regexp')
例如,来看下面这张表:
CREATE TABLE default.col_names (aa Int8, ab Int8, bc Int8) ENGINE = TinyLog
以下查询从名称中包含 a 符号的所有列中选取数据。
SELECT COLUMNS('a') FROM col_names
┌─aa─┬─ab─┐
│  1 │  1 │
└────┴────┘
返回选中列时,不会按字母顺序排列。 你可以在一个查询中使用多个 COLUMNS 表达式,并对其应用函数。 例如:
SELECT COLUMNS('a'), COLUMNS('c'), toTypeName(COLUMNS('c')) FROM col_names
┌─aa─┬─ab─┬─bc─┬─toTypeName(bc)─┐
│  1 │  1 │  1 │ Int8           │
└────┴────┴────┴────────────────┘
COLUMNS 表达式返回的每一列都会作为单独的参数传递给函数。此外,如果函数支持,也可以向其传递其他参数。使用函数时请务必小心。如果某个函数不支持你传入的参数个数,ClickHouse 会抛出异常。 例如:
SELECT COLUMNS('a') + COLUMNS('c') FROM col_names
Received exception from server (version 19.14.1):
Code: 42. DB::Exception: Received from localhost:9000. DB::Exception: Number of arguments for function plus does not match: passed 3, should be 2.
在此示例中,COLUMNS('a') 返回两列:aaabCOLUMNS('c') 返回 bc 列。+ 运算符不能用于 3 个参数,因此 ClickHouse 会抛出带有相应消息的异常。 COLUMNS 表达式匹配的列可以具有不同的数据类型。如果 COLUMNS 没有匹配到任何列,且它是 SELECT 中唯一的表达式,则 ClickHouse 会抛出异常。

星号

你可以在查询的任意位置用星号代替表达式。查询在分析时,星号会展开为表中所有列的列表 (不包括 MATERIALIZEDALIAS 列) 。只有以下几种情况适合使用星号:
  • 创建表转储时。
  • 对于仅包含少量列的表,例如系统表。
  • 用于查看表中有哪些列。在这种情况下,可设置 LIMIT 1。不过,更好的方式是使用 DESC TABLE 查询。
  • 使用 PREWHERE 对少量列进行强过滤时。
  • 在子查询中 (因为外部查询不需要的列会从子查询中排除) 。
在其他所有情况下,我们都不建议使用星号,因为它只会带来列式 DBMS 的缺点,而体现不出其优势。换句话说,不推荐使用星号。

极值

除了查询结果外,您还可以获取结果列的最小值和最大值。为此,请将 extremes 设置为 1。系统会对数值类型、日期类型以及日期时间类型计算最小值和最大值。对于其他列,则输出默认值。 系统会额外计算两行——分别表示最小值和最大值。这额外的两行会在 XMLJSON*TabSeparated*CSV*VerticalTemplatePretty* 格式中与其他行分开输出。其他格式则不会输出。 JSON*XML 格式中,极值会输出在单独的 extremes 字段中。在 TabSeparated*CSV*Vertical 格式中,这两行会出现在主结果之后;如果存在 totals,则也会位于其后。它们前面会有一个空行 (即在其他数据之后) 。在 Pretty* 格式中,这两行会作为单独的表输出在主结果之后;如果存在 totals,则也会位于其后。在 Template 格式中,极值会按照指定模板输出。 极值是在 LIMIT 之前、但在 LIMIT BY 之后的行上计算的。不过,在使用 LIMIT offset, size 时,offset 之前的行也会计入 extremes。在流式请求中,结果还可能包含少量已通过 LIMIT 的行。

说明

你可以在查询的任何部分使用别名 (AS 别名) 。 GROUP BYORDER BYLIMIT BY 子句支持位置参数。要启用此功能,请打开 enable_positional_arguments 设置。例如,ORDER BY 1,2 会先按表中的第 1 列、再按第 2 列对行进行排序。

实现细节

如果查询中省略了 DISTINCTGROUP BYORDER BY 子句,以及 INJOIN 子查询,则整个查询都将以流式方式处理,只需使用 O(1) 量级的 RAM。否则,如果没有设置适当的限制,查询可能会消耗大量 RAM:
  • max_memory_usage
  • max_rows_to_group_by
  • max_rows_to_sort
  • max_rows_in_distinct
  • max_bytes_in_distinct
  • max_rows_in_set
  • max_bytes_in_set
  • max_rows_in_join
  • max_bytes_in_join
  • max_bytes_before_external_sort
  • max_bytes_ratio_before_external_sort
  • max_bytes_before_external_group_by
  • max_bytes_ratio_before_external_group_by
更多信息,请参见“Settings”一节。也可以使用外部排序 (将临时表保存到磁盘) 和外部聚合。

SELECT 修饰符

你可以在 SELECT 查询中使用以下修饰符。
修饰符描述
APPLY允许你对查询外层表表达式返回的每一行调用某个函数。
EXCEPT指定要从结果中排除的一个或多个列名。所有匹配的列名都会从输出中省略。
REPLACE指定一个或多个表达式别名。每个别名都必须与 SELECT * 语句中的某个列名匹配。在输出列列表中,与别名匹配的列会被该 REPLACE 中的表达式替换。此修饰符不会更改列的名称或顺序,但可以更改值及其类型。

修饰符组合

你可以单独使用每个修饰符,也可以组合使用。 示例: 多次使用同一个修饰符。
SELECT COLUMNS('[jk]') APPLY(toString) APPLY(length) APPLY(max) FROM columns_transformers;
┌─max(length(toString(j)))─┬─max(length(toString(k)))─┐
│                        2 │                        3 │
└──────────────────────────┴──────────────────────────┘
在一个查询中使用多个修饰符。
SELECT * REPLACE(i + 1 AS i) EXCEPT (j) APPLY(sum) from columns_transformers;
┌─sum(plus(i, 1))─┬─sum(k)─┐
│             222 │    347 │
└─────────────────┴────────┘

SELECT 查询中的 SETTINGS

你可以直接在 SELECT 查询中指定所需设置。该设置值仅对此查询生效,并会在查询执行后恢复为默认值或之前的值。 有关设置的其他指定方式,请参见这里 对于值为 true 的布尔设置,你可以省略赋值,使用简写语法。仅指定设置名称时,它会自动设为 1 (true) 。 示例
SELECT * FROM some_table SETTINGS optimize_read_in_order=1, cast_keep_nullable=1;
最后修改于 2026年6月10日