Configuración de formatos - ClickHouse Documentation

Estos ajustes se generan automáticamente a partir del código fuente.

allow_special_bool_values_inside_variant

Permite interpretar valores Bool dentro del tipo Variant a partir de representaciones textuales especiales de valores booleanos, como “on”, “off”, “enable”, “disable”, etc.

bool_false_representation

Texto que representa el valor booleano false en los formatos TSV/CSV/Vertical/Pretty.

bool_true_representation

Texto para representar el valor booleano verdadero en los formatos TSV/CSV/Vertical/Pretty.

check_conversion_from_numbers_to_enum

Lanza una excepción durante la conversión de Numbers a Enum si el valor no existe en Enum. Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

Ejemplo

CREATE TABLE tab (
  val Enum('first' = 1, 'second' = 2, 'third' = 3)
) ENGINE = Memory;

INSERT INTO tab SETTINGS check_conversion_from_numbers_to_enum = 1 VALUES (4); -- devuelve un error

column_names_for_schema_inference

La lista de nombres de columnas que se usarán en la inferencia del esquema para formatos sin nombres de columna. Formato: ‘column1,column2,column3,…‘

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

Elimina dinámicamente los ceros finales de los valores de datetime64 para ajustar la escala de salida a [0, 3, 6], correspondientes a ‘segundos’, ‘milisegundos’ y ‘microsegundos’

date_time_input_format

Permite elegir un analizador para la representación textual de la fecha y la hora. Esta configuración no se aplica a las funciones de fecha y hora. Valores posibles:

'best_effort' — Habilita el análisis extendido. ClickHouse puede analizar el formato básico YYYY-MM-DD HH:MM:SS y todos los formatos de fecha y hora ISO 8601. Por ejemplo, '2018-06-08T01:02:03.000Z'.
'best_effort_us' — Similar a best_effort (consulte la diferencia en parseDateTimeBestEffortUS
'basic' — Usa el analizador básico. ClickHouse puede analizar solo el formato básico YYYY-MM-DD HH:MM:SS o YYYY-MM-DD. Por ejemplo, 2019-08-20 10:18:56 o 2019-08-20.

Véase también:

date_time_output_format

Permite elegir distintos formatos de salida para la representación textual de la fecha y la hora. Valores posibles:

simple - Formato de salida simple. ClickHouse muestra la fecha y la hora en formato YYYY-MM-DD hh:mm:ss. Por ejemplo, 2019-08-20 10:18:56. El cálculo se realiza según la zona horaria del tipo de dato (si está presente) o la zona horaria del servidor.
iso - Formato de salida ISO. ClickHouse muestra la fecha y la hora en formato ISO 8601 YYYY-MM-DDThh:mm:ssZ. Por ejemplo, 2019-08-20T10:18:56Z. Tenga en cuenta que la salida se muestra en UTC (Z significa UTC).
unix_timestamp - Formato de salida como Unix timestamp. ClickHouse muestra la fecha y la hora en formato Unix timestamp. Por ejemplo, 1566285536.

Véase también:

date_time_overflow_behavior

Define el comportamiento cuando Date, Date32, DateTime, DateTime64 o enteros se convierten a Date, Date32, DateTime o DateTime64, pero el valor no puede representarse en el tipo de resultado. Valores posibles:

ignore — Ignora silenciosamente los desbordamientos. El resultado es indefinido.
throw — Lanza una excepción en caso de desbordamiento.
saturate — Satura el resultado. Si el valor es menor que el valor mínimo que puede representar el tipo de destino, el resultado será el valor representable más pequeño. Si el valor es mayor que el valor máximo que puede representar el tipo de destino, el resultado será el valor representable más grande.

Valor predeterminado: ignore.

errors_output_format

Método para escribir errores en la salida de texto.

format_avro_schema_registry_connection_timeout

Para el formato AvroConfluent: tiempo de espera de conexión en segundos del cliente HTTP de Confluent Schema Registry. Se usa tanto para la obtención como para el registro de esquemas. Debe ser mayor que 0 y menor que 600 (10 minutos).

format_avro_schema_registry_receive_timeout

Para el formato AvroConfluent: tiempo de espera de recepción en segundos del cliente HTTP de Confluent Schema Registry. Se utiliza tanto para la obtención de esquemas como para el registro de esquemas. Debe ser mayor que 0 y menor que 600 (10 minutos).

format_avro_schema_registry_send_timeout

Para el formato AvroConfluent: tiempo de espera de envío, en segundos, para el cliente HTTP de Confluent Schema Registry. Se utiliza tanto para la obtención del esquema como para el registro del esquema. Debe ser mayor que 0 y menor que 600 (10 minutos).

format_avro_schema_registry_url

Para el formato AvroConfluent: URL del Confluent Schema Registry.

format_binary_max_array_size

El tamaño máximo permitido para Array en el formato RowBinary. Evita asignar una gran cantidad de memoria en caso de que los datos estén dañados. 0 significa que no hay límite

format_binary_max_object_size

El número máximo permitido de rutas en un solo objeto para el formato RowBinary del tipo JSON. Esto evita asignar una gran cantidad de memoria en caso de datos corruptos. 0 significa que no hay límite

format_binary_max_string_size

El tamaño máximo permitido de String en el formato RowBinary. Evita asignar grandes cantidades de memoria en caso de datos corruptos. 0 significa que no hay límite

format_capn_proto_enum_comparising_mode

Cómo asignar correspondencias entre Enum de ClickHouse y Enum de CapnProto

format_capn_proto_max_message_size

Tamaño máximo de un solo mensaje CapnProto, en bytes. Esto protege frente a datos malformados o corruptos que puedan provocar una asignación excesiva de memoria. El valor predeterminado es 1 GiB.

format_capn_proto_use_autogenerated_schema

Usa el esquema de CapnProto autogenerado cuando no se haya establecido format_schema

format_csv_allow_double_quotes

Si se establece en true, permite cadenas entre comillas dobles.

format_csv_allow_single_quotes

Si se establece en true, permite cadenas entre comillas simples.

format_csv_delimiter

El carácter que se considera delimitador en los datos CSV. Si se configura como una cadena, esta debe tener una longitud de 1.

format_csv_null_representation

Representación personalizada de NULL en formato CSV

format_custom_escaping_rule

Regla de escape para campos (para el formato CustomSeparated)

format_custom_field_delimiter

Delimitador entre campos (para el formato CustomSeparated)

format_custom_result_after_delimiter

Sufijo tras el conjunto de resultados (para el formato CustomSeparated)

format_custom_result_before_delimiter

Prefijo antes del conjunto de resultados (para el formato CustomSeparated)

format_custom_row_after_delimiter

Delimitador después del campo de la última columna (para el formato CustomSeparated)

format_custom_row_before_delimiter

Delimitador antes del campo de la primera columna (en el formato CustomSeparated)

format_custom_row_between_delimiter

Delimitador entre filas (para el formato CustomSeparated)

format_display_secrets_in_show_and_select

Habilita o deshabilita la visualización de secretos en las consultas SHOW y SELECT de tablas, bases de datos, funciones de tabla y diccionarios. El usuario que desee ver secretos también debe tener la configuración del servidor display_secrets_in_show_and_select activada y el privilegio displaySecretsInShowAndSelect. Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

format_json_object_each_row_column_for_object_name

El nombre de la columna que se utilizará para almacenar o escribir nombres de objetos en el formato JSONObjectEachRow. El tipo de la columna debe ser String. Si el valor está vacío, se usarán los nombres predeterminados row_{i} como nombres de objeto.

format_protobuf_use_autogenerated_schema

Usa Protobuf autogenerado cuando no se configure format_schema

format_regexp

Expresión regular (para el formato Regexp)

format_regexp_escaping_rule

Regla de escape de campo (para formato Regexp)

format_regexp_skip_unmatched

Omite las líneas que no coincidan con la expresión regular (para el formato Regexp)

format_schema

Este parámetro resulta útil cuando se usan formatos que requieren una definición de esquema, como Cap’n Proto o Protobuf. El valor depende del formato.

format_schema_message_name

Define el nombre del mensaje requerido en el esquema definido en format_schema. Para mantener la compatibilidad con el formato heredado de format_schema (file_name:message_name):

Si no se especifica format_schema_message_name, el nombre del mensaje se deduce de la parte message_name del valor heredado de format_schema.
Si se especifica format_schema_message_name mientras se usa el formato heredado, se producirá un error.

format_schema_source

Define el origen de format_schema. Valores posibles:

‘file’ (por defecto): format_schema es el nombre de un archivo de esquema ubicado en el directorio format_schemas.
‘string’: format_schema es el contenido literal del esquema.
‘query’: format_schema es una consulta para obtener el esquema. Cuando format_schema_source se establece en ‘query’, se aplican las siguientes condiciones:
La consulta debe devolver exactamente un valor: una sola fila con una sola columna de tipo cadena.
El resultado de la consulta se trata como el contenido del esquema.
Este resultado se almacena en caché localmente en el directorio format_schemas.
Puede borrar la caché local con el comando: SYSTEM DROP FORMAT SCHEMA CACHE FOR Files.
Una vez almacenadas en caché, las consultas idénticas no se vuelven a ejecutar para obtener el esquema hasta que la caché se borre explícitamente.
Además de los archivos de caché locales, los mensajes de Protobuf también se almacenan en caché en memoria. Incluso después de borrar los archivos de caché locales, la caché en memoria debe borrarse con SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf] para actualizar completamente el esquema.
Ejecute la consulta SYSTEM DROP FORMAT SCHEMA CACHE para borrar de una sola vez la caché tanto de los archivos de caché como de los esquemas de mensajes Protobuf.

format_template_resultset

Ruta del archivo que contiene la cadena de formato del conjunto de resultados (para el formato Template)

format_template_resultset_format

Cadena de formato para el conjunto de resultados (para el formato Template)

format_template_row

Ruta del archivo que contiene la cadena de formato para las filas (para el formato Template)

format_template_row_format

Cadena de formato para filas (para el formato Template)

format_template_rows_between_delimiter

Delimitador entre filas (para el formato Template)

format_tsv_null_representation

Representación personalizada de NULL en formato TSV

input_format_allow_errors_num

Establece el número máximo de errores aceptables al leer formatos de texto (CSV, TSV, etc.). El valor predeterminado es 0. Utilícelo siempre junto con input_format_allow_errors_ratio. Si se produce un error al leer filas, pero el contador de errores sigue siendo menor que input_format_allow_errors_num, ClickHouse ignora la fila y pasa a la siguiente. Si se superan tanto input_format_allow_errors_num como input_format_allow_errors_ratio, ClickHouse lanza una excepción.

input_format_allow_errors_ratio

Establece el porcentaje máximo de errores permitido al leer formatos de texto (CSV, TSV, etc.). El porcentaje de errores se define como un número de coma flotante entre 0 y 1. El valor predeterminado es 0. Úselo siempre junto con input_format_allow_errors_num. Si se produce un error al leer filas, pero el contador de errores sigue siendo inferior a input_format_allow_errors_ratio, ClickHouse ignora la fila y pasa a la siguiente. Si se superan tanto input_format_allow_errors_num como input_format_allow_errors_ratio, ClickHouse lanza una excepción.

input_format_allow_seeks

Permite realizar reposicionamientos (o lecturas por rango) al leer los formatos de entrada ORC, Parquet y Arrow. Cuando está habilitado y el origen lo admite (por ejemplo, un archivo local, S3 o HTTP con compatibilidad con rangos y tamaño conocido), ClickHouse puede leer solo los rangos de bytes necesarios y usar menos memoria. Cuando está deshabilitado, o cuando el origen no admite reposicionamientos (por ejemplo, si no se conoce el tamaño del archivo o el flujo no permite reposicionarse), algunos lectores pueden optar por cargar el archivo completo en memoria. Habilitado de forma predeterminada.

input_format_arrow_allow_missing_columns

Permite columnas ausentes al leer formatos de entrada Arrow

input_format_arrow_case_insensitive_column_matching

No distingue entre mayúsculas y minúsculas al hacer coincidir las columnas de Arrow con las columnas de CH.

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

Omitir las columnas con tipos no admitidos durante la inferencia del esquema para el formato Arrow

input_format_avro_allow_missing_fields

Para el formato Avro/AvroConfluent: cuando no se encuentra un campo en el esquema, se utiliza el valor predeterminado en lugar de generar un error

input_format_avro_null_as_default

Para el formato Avro/AvroConfluent: inserta el valor predeterminado en caso de NULL y de columna no Nullable

input_format_binary_decode_types_in_binary_format

Leer tipos de datos en formato binario en lugar de nombres de tipos en el formato de entrada RowBinaryWithNamesAndTypes

input_format_binary_max_type_complexity

Número máximo de nodos de tipo al decodificar tipos binarios (no la profundidad, sino el número total). Map(String, UInt32) = 3 nodos. Protege contra entradas maliciosas. 0 = ilimitado.

input_format_binary_read_json_as_string

Lee valores del tipo de dato JSON como valores String JSON en el formato de entrada RowBinary.

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

Omite los campos con tipos no compatibles durante la inferencia del esquema del formato BSON.

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

Omitir las columnas con tipos no compatibles durante la inferencia del esquema para el formato CapnProto

input_format_column_name_matching_mode

Define el modo de coincidencia de los nombres de columna al ingestar datos a través de varios formatos (incluidos, entre otros, JSONEachRow, CSVWithNames, JSONColumns, BSONEachRow, RowBinaryWithNames). Modos compatibles:

match_case: distingue mayúsculas y minúsculas
- ignore_case: no distingue mayúsculas y minúsculas
- auto: primero intenta hacer la coincidencia distinguiendo mayúsculas y minúsculas; si falla, la intenta sin distinguir mayúsculas y minúsculas.

input_format_connection_handling

Cuando esta opción está activada, si la conexión se cierra inesperadamente, los datos que queden en el búfer se analizarán y procesarán en lugar de tratarse como un error

Activar esta opción desactiva el análisis en paralelo e impide la deduplicación

input_format_csv_allow_cr_end_of_line

Si se establece en true, se permitirá \r al final de la línea sin que vaya seguido de

input_format_csv_allow_variable_number_of_columns

Ignora las columnas adicionales en la entrada CSV (si el archivo tiene más columnas de las esperadas) y trata los campos que faltan en la entrada CSV como valores por defecto

input_format_csv_allow_whitespace_or_tab_as_delimiter

Permite usar espacios y tabuladores (\t) como delimitadores de campo en las cadenas CSV

input_format_csv_arrays_as_nested_csv

Al leer Array desde CSV, se espera que sus elementos se hayan serializado como CSV anidado y luego se hayan colocado en una cadena. Ejemplo: ”[""Hello"", ""world"", ""42"""" TV""]”. Se pueden omitir los corchetes alrededor del arreglo.

input_format_csv_deserialize_separate_columns_into_tuple

Si se establece en true, las columnas independientes escritas en formato CSV pueden deserializarse en una columna de tipo Tuple.

input_format_csv_detect_header

Detectar automáticamente la fila de encabezado con nombres y tipos en formato CSV

input_format_csv_empty_as_default

Considera los campos vacíos en la entrada CSV como valores predeterminados.

input_format_csv_enum_as_number

Considera los valores enum insertados en formatos CSV como índices de enum

input_format_csv_skip_first_lines

Omite el número especificado de líneas al inicio de los datos en formato CSV

input_format_csv_skip_trailing_empty_lines

Omite las líneas vacías al final en formato CSV

input_format_csv_trim_whitespaces

Elimina los espacios y tabulaciones (\t) al principio y al final de las cadenas CSV

input_format_csv_try_infer_numbers_from_strings

Si está habilitada, durante la inferencia del esquema, ClickHouse intentará inferir números a partir de campos de cadena. Puede ser útil si los datos CSV contienen números UInt64 entre comillas. Deshabilitada de forma predeterminada.

input_format_csv_try_infer_strings_from_quoted_tuples

Interpreta las Tuples entrecomilladas en los datos de entrada como un valor de tipo String.

input_format_csv_use_best_effort_in_schema_inference

Utiliza algunos ajustes y heurísticas para inferir el esquema en formato CSV

input_format_csv_use_default_on_bad_values

Permite establecer el valor predeterminado de la columna cuando falla la deserialización de un campo CSV debido a un valor no válido

input_format_custom_allow_variable_number_of_columns

Ignora las columnas adicionales en la entrada CustomSeparated (si el archivo tiene más columnas de las esperadas) y trata los campos que faltan en la entrada CustomSeparated como valores predeterminados.

input_format_custom_detect_header

Detecta automáticamente el encabezado con nombres y tipos en el formato CustomSeparated

input_format_custom_skip_trailing_empty_lines

Omitir las líneas vacías finales del formato CustomSeparated

input_format_defaults_for_omitted_fields

Al realizar consultas INSERT, sustituye los valores omitidos de las columnas de entrada por los valores predeterminados de las columnas correspondientes. Esta opción se aplica a JSONEachRow (y otros formatos JSON), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native y a los formatos con los sufijos WithNames/WithNamesAndTypes.

Cuando esta opción está habilitada, se envían metadatos ampliados de la tabla desde el servidor al cliente. Esto consume recursos de procesamiento adicionales en el servidor y puede reducir el rendimiento.

Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

input_format_force_null_for_omitted_fields

Forzar la inicialización de los campos omitidos con valores NULL

input_format_hive_text_allow_variable_number_of_columns

Ignorar las columnas adicionales en la entrada de Hive Text (si el archivo tiene más columnas de las esperadas) y tratar los campos que falten en la entrada de Hive Text como valores por defecto

input_format_hive_text_collection_items_delimiter

Delimitador entre los elementos de una colección (array o map) en Hive Text File

input_format_hive_text_fields_delimiter

Delimitador entre campos de Hive Text File

input_format_hive_text_map_keys_delimiter

Delimitador entre la clave y el valor de un par de map en Hive Text File

input_format_import_nested_json

Habilita o deshabilita la inserción de datos JSON que contienen objetos anidados. Formatos compatibles:

JSONEachRow

Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

Véase también:

Uso de estructuras anidadas con el formato JSONEachRow.

input_format_ipv4_default_on_conversion_error

La deserialización de IPv4 usará valores predeterminados en lugar de generar una excepción si se produce un error de conversión. Desactivado de forma predeterminada.

input_format_ipv6_default_on_conversion_error

La deserialización de IPv6 usará valores predeterminados en lugar de lanzar una excepción si se produce un error de conversión. Deshabilitado de forma predeterminada.

input_format_json_compact_allow_variable_number_of_columns

Permite un número variable de columnas en las filas de los formatos de entrada JSONCompact/JSONCompactEachRow. Ignora las columnas adicionales en las filas con más columnas de las previstas y considera las columnas que faltan como valores predeterminados. Deshabilitado de forma predeterminada.

input_format_json_defaults_for_missing_elements_in_named_tuple

Inserta valores predeterminados para los elementos que faltan en el objeto JSON al analizar una tupla con nombre. Esta configuración solo funciona cuando la opción input_format_json_named_tuples_as_objects está habilitada. Está habilitada de forma predeterminada.

input_format_json_empty_as_default

Cuando está habilitada, sustituye los campos vacíos de la entrada JSON por valores predeterminados. Para expresiones de valor predeterminado complejas, también debe estar habilitado input_format_defaults_for_omitted_fields. Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

input_format_json_ignore_unknown_keys_in_named_tuple

Ignora las claves desconocidas en objetos JSON para las tuplas con nombre. Habilitado de forma predeterminada.

input_format_json_ignore_unnecessary_fields

Ignora los campos innecesarios y no los analiza. Al activarlo, puede que no se lancen excepciones en cadenas JSON con formato no válido o con campos duplicados

input_format_json_infer_array_of_dynamic_from_array_of_different_types

Si está habilitado, durante la inferencia del esquema, ClickHouse utilizará el tipo Array(Dynamic) para arrays JSON con valores de distintos tipos de datos. Ejemplo:

SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=1;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');

┌─name─┬─type───────────┐
│ a    │ Array(Dynamic) │
└──────┴────────────────┘

SET input_format_json_infer_array_of_dynamic_from_array_of_different_types=0;
DESC format(JSONEachRow, '{"a" : [42, "hello", [1, 2, 3]]}');

┌─name─┬─type─────────────────────────────────────────────────────────────┐
│ a    │ Tuple(Nullable(Int64), Nullable(String), Array(Nullable(Int64))) │
└──────┴──────────────────────────────────────────────────────────────────┘

Habilitado de forma predeterminada.

input_format_json_infer_incomplete_types_as_strings

Permite usar el tipo String para claves de JSON que contienen solo Null/{}/[] en la muestra de datos durante la inferencia del esquema. En formatos JSON, cualquier valor puede leerse como String, y es posible evitar errores como

Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps

durante la inferencia del esquema usando el tipo String para claves con tipos desconocidos. Ejemplo:

SET input_format_json_infer_incomplete_types_as_strings = 1, input_format_json_try_infer_named_tuples_from_objects = 1;
DESCRIBE format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
SELECT * FROM format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');

Resultado:

┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj  │ Tuple(a Array(Nullable(Int64)), b Nullable(String), c Nullable(String), d Nullable(String), e Array(Nullable(String))) │              │                    │         │                  │                │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘

┌─obj────────────────────────────┐
│ ([1,2,3],'hello',NULL,'{}',[]) │
└────────────────────────────────┘

Activado de forma predeterminada.

input_format_json_map_as_array_of_tuples

Deserializa las columnas de tipo Map como arrays JSON de tuplas. Desactivado de forma predeterminada.

input_format_json_max_depth

Profundidad máxima de un campo en JSON. No es un límite estricto y no es necesario que se aplique con exactitud.

input_format_json_named_tuples_as_objects

Interpreta las columnas de tuplas con nombre como objetos JSON. Habilitado de forma predeterminada.

input_format_json_read_arrays_as_strings

Permite interpretar arrays JSON como cadenas en los formatos de entrada JSON. Ejemplo:

SET input_format_json_read_arrays_as_strings = 1;
SELECT arr, toTypeName(arr), JSONExtractArrayRaw(arr)[3] from format(JSONEachRow, 'arr String', '{"arr" : [1, "Hello", [1,2,3]]}');

Resultado:

┌─arr───────────────────┬─toTypeName(arr)─┬─arrayElement(JSONExtractArrayRaw(arr), 3)─┐
│ [1, "Hello", [1,2,3]] │ String          │ [1,2,3]                                   │
└───────────────────────┴─────────────────┴───────────────────────────────────────────┘

Activado de forma predeterminada.

input_format_json_read_bools_as_numbers

Permite interpretar valores booleanos como números en los formatos de entrada JSON. Está habilitado de forma predeterminada.

input_format_json_read_bools_as_strings

Permite analizar valores booleanos como cadenas en formatos de entrada JSON. Habilitado de forma predeterminada.

input_format_json_read_numbers_as_strings

Permite analizar números como cadenas en formatos de entrada JSON. Habilitado de forma predeterminada.

input_format_json_read_objects_as_strings

Permite analizar objetos JSON como cadenas en los formatos de entrada JSON. Ejemplo:

SET input_format_json_read_objects_as_strings = 1;
CREATE TABLE test (id UInt64, obj String, date Date) ENGINE=Memory();
INSERT INTO test FORMAT JSONEachRow {"id" : 1, "obj" : {"a" : 1, "b" : "Hello"}, "date" : "2020-01-01"};
SELECT * FROM test;

Resultado:

┌─id─┬─obj──────────────────────┬───────date─┐
│  1 │ {"a" : 1, "b" : "Hello"} │ 2020-01-01 │
└────┴──────────────────────────┴────────────┘

Habilitado de forma predeterminada.

input_format_json_throw_on_bad_escape_sequence

Lanza una excepción si una cadena JSON contiene una secuencia de escape no válida en los formatos de entrada JSON. Si se desactiva, las secuencias de escape no válidas permanecerán tal cual en los datos. Activado de forma predeterminada.

input_format_json_try_infer_named_tuples_from_objects

Si está habilitado, durante la inferencia del esquema, ClickHouse intentará inferir un Tuple con nombre a partir de objetos JSON. El Tuple con nombre resultante contendrá todos los elementos de todos los objetos JSON correspondientes presentes en los datos de muestra. Ejemplo:

SET input_format_json_try_infer_named_tuples_from_objects = 1;
DESC format(JSONEachRow, '{"obj" : {"a" : 42, "b" : "Hello"}}, {"obj" : {"a" : 43, "c" : [1, 2, 3]}}, {"obj" : {"d" : {"e" : 42}}}')

Resultado:

┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj  │ Tuple(a Nullable(Int64), b Nullable(String), c Array(Nullable(Int64)), d Tuple(e Nullable(Int64))) │              │                    │         │                  │                │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘

Habilitado de forma predeterminada.

input_format_json_try_infer_numbers_from_strings

Si está habilitado, durante la inferencia del esquema ClickHouse intentará inferir números a partir de campos de tipo cadena. Puede resultar útil si los datos JSON contienen números UInt64 entre comillas. Deshabilitado de forma predeterminada.

input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects

Usa el tipo String en lugar de generar una excepción en caso de rutas ambiguas en objetos JSON durante la inferencia de tuplas con nombre

input_format_json_validate_types_from_metadata

Para los formatos de entrada JSON/JSONCompact/JSONColumnsWithMetadata, si esta configuración se establece en 1, los tipos de los metadatos de los datos de entrada se compararán con los tipos de las columnas correspondientes de la tabla. Habilitado de forma predeterminada.

input_format_max_block_size_bytes

Limita, en bytes, el tamaño de los bloques que se forman durante el análisis de datos en los formatos de entrada. Se utiliza en formatos de entrada basados en filas cuando el bloque se forma del lado de ClickHouse. 0 significa que no hay límite en bytes.

input_format_max_block_wait_ms

Limita el tiempo máximo de espera, en milisegundos, antes de emitir un bloque durante el análisis en formatos de entrada basados en filas. 0 significa que no hay límite.

Esta opción solo funciona si input_format_connection_handling está habilitado. Establecer un valor también desactiva el análisis en paralelo y hace imposible la deduplicación.

Para inserts de streaming, también se deben establecer min_insert_block_size_rows=0 y min_insert_block_size_bytes=0. De lo contrario, los bloques analizados pueden seguir acumulándose en memoria durante la etapa de squashing de bloques hasta que se alcancen esos umbrales, lo que impide que los inserts se realicen a tiempo.

Ejemplo: transmitir cambios recientes de Wikipedia a ClickHouse

clickhouse-client --query 'CREATE TABLE wikipedia_edits (data JSON)'

curl -sS --globoff -H 'Accept: application/json' --no-buffer \
  'https://stream.wikimedia.org/v2/stream/recentchange' \
  | clickhouse-client \
      --query 'INSERT INTO wikipedia_edits FORMAT JSONAsObject' \
      --input_format_max_block_wait_ms 1000 \
      --input_format_connection_handling 1 \
      --min_insert_block_size_rows 0 \
      --min_insert_block_size_bytes 0

input_format_max_bytes_to_read_for_schema_inference

La cantidad máxima de datos, en bytes, que se puede leer para la inferencia automática del esquema.

input_format_max_rows_to_read_for_schema_inference

El número máximo de filas de datos que se pueden leer para la inferencia automática del esquema.

input_format_msgpack_number_of_columns

El número de columnas de los datos MsgPack insertados. Se utiliza para la inferencia automática del esquema a partir de los datos.

input_format_mysql_dump_map_column_names

Hace coincidir las columnas de la tabla del volcado de MySQL con las columnas de la tabla de ClickHouse por nombre

input_format_mysql_dump_table_name

Nombre de la tabla del volcado de MySQL de la que se leen los datos

input_format_native_allow_types_conversion

Permitir la conversión de tipos en el formato de entrada Native

input_format_native_decode_types_in_binary_format

Leer los tipos de datos en formato binario en lugar de los nombres de tipo en el formato de entrada Native

input_format_null_as_default

Habilita o deshabilita la inicialización de campos NULL con valores predeterminados, si el tipo de dato de estos campos no es Nullable. Si el tipo de columna no es Nullable y esta configuración está deshabilitada, insertar NULL provoca una excepción. Si el tipo de columna es Nullable, los valores NULL se insertan tal cual, independientemente de esta configuración. Esta configuración se aplica a la mayoría de los formatos de entrada. Para expresiones predeterminadas complejas, input_format_defaults_for_omitted_fields también debe estar habilitada. Valores posibles:

0 — Insertar NULL en una columna no Nullable provoca una excepción.
1 — Los campos NULL se inicializan con los valores predeterminados de la columna.

input_format_orc_allow_missing_columns

Permite columnas ausentes al leer formatos de entrada ORC

input_format_orc_case_insensitive_column_matching

No distingue entre mayúsculas y minúsculas al hacer coincidir columnas ORC con columnas de CH.

input_format_orc_dictionary_as_low_cardinality

Trata las columnas ORC codificadas con diccionario como columnas LowCardinality al leer archivos ORC.

input_format_orc_filter_push_down

Al leer archivos ORC, omita stripes enteros o grupos de filas completos en función de las expresiones WHERE/PREWHERE, las estadísticas mín./máx. o el bloom filter de los metadatos de ORC.

input_format_orc_reader_time_zone_name

El nombre de la zona horaria del lector de filas ORC; la zona horaria predeterminada del lector de filas ORC es GMT.

input_format_orc_row_batch_size

Tamaño del lote al leer stripes de archivos ORC.

input_format_orc_skip_columns_with_unsupported_types_in_schema_inference

Omitir las columnas con tipos no compatibles durante la inferencia del esquema para el formato ORC

input_format_orc_use_fast_decoder

Usa una implementación más rápida del decodificador ORC.

input_format_parallel_parsing

Habilita o deshabilita el análisis paralelo de los formatos de datos conservando el orden. Solo es compatible con los formatos TabSeparated (TSV), TSKV, CSV y JSONEachRow. Valores posibles:

1 — Habilitado.
0 — Deshabilitado.

input_format_parquet_allow_geoparquet_parser

Use el analizador de columnas Geo para convertir Array(UInt8) en tipos Point/Linestring/Polygon/MultiLineString/MultiPolygon

input_format_parquet_allow_missing_columns

Permite columnas ausentes al leer formatos de entrada Parquet

input_format_parquet_bloom_filter_push_down

Al leer archivos Parquet, omite grupos de filas enteros en función de las expresiones WHERE y del bloom filter de los metadatos de Parquet.

input_format_parquet_case_insensitive_column_matching

Ignora las mayúsculas y minúsculas al hacer coincidir columnas de Parquet con columnas de CH.

input_format_parquet_enable_json_parsing

Al leer archivos Parquet, interpreta las columnas JSON como columnas JSON de ClickHouse.

input_format_parquet_enable_row_group_prefetch

Habilita la precarga de grupos de filas durante el análisis de Parquet. Actualmente, solo el análisis en un solo hilo puede realizar precarga.

input_format_parquet_filter_push_down

Al leer archivos Parquet, omite grupos de filas enteros en función de las expresiones WHERE/PREWHERE y de las estadísticas mín./máx. de los metadatos de Parquet.

input_format_parquet_local_file_min_bytes_for_seek

Bytes mínimos necesarios para que una lectura local (archivo) haga seek, en lugar de leer ignorando datos, en el formato de entrada Parquet

input_format_parquet_local_time_as_utc

Determina el tipo de dato que usa la inferencia del esquema para las marcas de tiempo de Parquet con isAdjustedToUTC=false. Si es true: DateTime64(…, ‘UTC’); si es false: DateTime64(…). Ninguno de los dos comportamientos es totalmente correcto, ya que ClickHouse no tiene un tipo de dato para la hora local según el reloj. Aunque resulte contraintuitivo, ‘true’ probablemente sea la opción menos incorrecta, porque al formatear la marca de tiempo ‘UTC’ como String se obtiene una representación de la hora local correcta.

input_format_parquet_max_block_size

Tamaño máximo de bloque del lector de Parquet.

input_format_parquet_memory_high_watermark

Límite de memoria aproximado para el lector de Parquet v3. Limita cuántos grupos de filas o columnas pueden leerse en paralelo. Al leer varios archivos en una sola consulta, el límite se aplica al uso total de memoria entre esos archivos.

input_format_parquet_memory_low_watermark

Programa las prelecturas de forma más agresiva si el uso de memoria está por debajo del umbral. Puede resultar útil, por ejemplo, si hay muchos bloom filters pequeños que leer por la red.

input_format_parquet_page_filter_push_down

Omite páginas utilizando los valores mín./máx. del índice de columna.

input_format_parquet_prefer_block_bytes

Promedio de bytes por bloque generado por el lector Parquet

input_format_parquet_preserve_order

Evita reordenar las filas al leer archivos Parquet. No se recomienda, ya que, por lo general, no se garantiza el orden de las filas y otras partes del pipeline de consulta pueden alterarlo. En su lugar, usa ORDER BY _row_number.

input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference

Omitir las columnas con tipos no compatibles durante la inferencia de esquema para el formato Parquet

input_format_parquet_use_offset_index

Ajuste menor en la forma de leer las páginas del archivo Parquet cuando no se usa el filtrado de páginas.

input_format_parquet_verify_checksums

Verifica las sumas de comprobación de las páginas al leer archivos Parquet.

input_format_protobuf_flatten_google_wrappers

Habilita los wrappers de Google para columnas normales no anidadas; por ejemplo, google.protobuf.StringValue ‘str’ para la columna String ‘str’. En las columnas Nullable, los wrappers vacíos se interpretan como valores predeterminados y la ausencia de wrappers como NULL

input_format_protobuf_oneof_presence

Indica qué campo de protobuf oneof se encontró mediante la asignación de un valor enum en una columna especial

input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference

Omite los campos con tipos no compatibles durante la inferencia de esquemas para el formato Protobuf

input_format_record_errors_file_path

Ruta del archivo que se utiliza para registrar errores durante la lectura de formatos de texto (CSV, TSV).

input_format_skip_unknown_fields

Activa o desactiva la omisión de datos adicionales durante la inserción. Al escribir datos, ClickHouse lanza una excepción si los datos de entrada contienen columnas que no existen en la tabla de destino. Si esta opción está habilitada, ClickHouse no inserta los datos adicionales y no lanza ninguna excepción. Formatos compatibles:

JSONEachRow (y otros formatos JSON)
BSONEachRow (y otros formatos JSON)
TSKV
Todos los formatos con sufijos WithNames/WithNamesAndTypes
MySQLDump
Native

Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

input_format_try_infer_dates

Si está habilitado, ClickHouse intentará inferir el tipo Date a partir de campos de texto durante la inferencia de esquemas para formatos de texto. Si todos los campos de una columna de los datos de entrada se interpretan correctamente como fechas, el tipo resultante será Date; si al menos un campo no se interpreta como fecha, el tipo resultante será String. Habilitado de forma predeterminada.

input_format_try_infer_datetimes

Si está habilitada, ClickHouse intentará inferir el tipo DateTime64 a partir de campos de tipo cadena durante la inferencia de esquema para formatos de texto. Si todos los campos de una columna de los datos de entrada se analizan correctamente como fechas y horas, el tipo resultante será DateTime64; si al menos un campo no se analiza como fecha y hora, el tipo resultante será String. Habilitada de forma predeterminada.

input_format_try_infer_datetimes_only_datetime64

Cuando input_format_try_infer_datetimes está habilitado, infiere solo DateTime64, pero no tipos DateTime

input_format_try_infer_exponent_floats

Intenta inferir números de coma flotante en notación exponencial durante la inferencia de esquema en formatos de texto (excepto JSON, donde los números con exponente siempre se infieren)

input_format_try_infer_integers

Si está habilitado, ClickHouse intentará inferir enteros en lugar de números de coma flotante durante la inferencia de esquema para formatos de texto. Si todos los números de la columna en los datos de entrada son enteros, el tipo resultante será Int64; si al menos uno de los números es de coma flotante, el tipo resultante será Float64. Habilitado de forma predeterminada.

input_format_try_infer_variants

Si está habilitada, ClickHouse intentará inferir el tipo Variant en la inferencia de esquema para formatos de texto cuando haya más de un tipo posible para elementos de columna/array. Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

input_format_tsv_allow_variable_number_of_columns

Ignora las columnas adicionales en la entrada TSV (si el archivo tiene más columnas de las esperadas) y considera los campos faltantes en la entrada TSV como valores predeterminados

input_format_tsv_crlf_end_of_line

Si se establece en true, la función file leerá el formato TSV usando \r\n en lugar de \n.

input_format_tsv_detect_header

Detecta automáticamente el encabezado con nombres y tipos en formato TSV

input_format_tsv_empty_as_default

Trata los campos vacíos de la entrada TSV como valores predeterminados.

input_format_tsv_enum_as_number

Trata los valores de enum insertados en formatos TSV como índices de enum.

input_format_tsv_skip_first_lines

Omite la cantidad especificada de líneas al inicio de los datos en formato TSV

input_format_tsv_skip_trailing_empty_lines

Omitir las líneas vacías al final en formato TSV

input_format_tsv_use_best_effort_in_schema_inference

Usa algunos ajustes y heurísticas para inferir el esquema en formato TSV

input_format_values_accurate_types_of_literals

Para el formato Values, al analizar e interpretar expresiones con Template, compruebe el tipo real del literal para evitar posibles problemas de desbordamiento y de precisión.

input_format_values_deduce_templates_of_expressions

Para el formato Values: si el campo no pudo analizarse con el parser de streaming, se ejecuta el parser SQL, se deduce la plantilla de la expresión SQL, se intenta analizar todas las filas usando la plantilla y luego se interpreta la expresión para todas las filas.

input_format_values_interpret_expressions

Para el formato Values: si el campo no pudo analizarse con el parser de streaming, ejecute el parser SQL e intente interpretarlo como una expresión SQL.

input_format_with_names_use_header

Activa o desactiva la comprobación del orden de las columnas al insertar datos. Para mejorar el rendimiento de la inserción, recomendamos desactivar esta comprobación si está seguro de que el orden de las columnas en los datos de entrada es el mismo que en la tabla de destino. Formatos compatibles:

Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

input_format_with_types_use_header

Controla si el analizador de formatos debe comprobar que los tipos de datos de los datos de entrada coincidan con los tipos de datos de la tabla de destino. Formatos compatibles:

Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

insert_distributed_one_random_shard

Habilita o deshabilita la inserción en un segmento aleatorio en una tabla Distributed cuando no hay una clave de distribución. De forma predeterminada, al insertar datos en una tabla Distributed con más de un segmento, el servidor de ClickHouse rechazará cualquier solicitud de inserción si no se ha definido una clave de distribución. Cuando insert_distributed_one_random_shard = 1, se permiten las inserciones y los datos se reenvían aleatoriamente entre todos los segmentos. Valores posibles:

0 — La inserción se rechaza si hay varios segmentos y no se proporciona una clave de distribución.
1 — La inserción se realiza aleatoriamente entre todos los segmentos disponibles cuando no se proporciona una clave de distribución.

interval_output_format

Permite elegir distintos formatos de salida para la representación textual de los tipos interval. Valores posibles:

kusto - formato de salida de estilo KQL. ClickHouse genera los intervalos en formato KQL. Por ejemplo, toIntervalDay(2) se formatearía como 2.00:00:00. Tenga en cuenta que, para los tipos interval de longitud variable (es decir, IntervalMonth y IntervalYear), se considera el número promedio de segundos por intervalo.
numeric - formato de salida numérico. ClickHouse genera los intervalos según su representación numérica subyacente. Por ejemplo, toIntervalDay(2) se formatearía como 2.

Véase también:

Interval

into_outfile_create_parent_directories

Crea automáticamente los directorios padre al usar INTO OUTFILE si aún no existen.

json_type_escape_dots_in_keys

Si está habilitado, los puntos de las claves JSON se escaparán durante el análisis.

max_dynamic_subcolumns_in_json_type_parsing

El número máximo de subcolumnas dinámicas que se pueden crear en cada columna durante el análisis de una columna de tipo JSON. Permite controlar el número de subcolumnas dinámicas durante el análisis, independientemente de los parámetros dinámicos especificados en el tipo de dato.

output_format_arrow_compression_method

Método de compresión para el formato de salida Arrow. Códecs compatibles: lz4_frame, zstd, none (sin comprimir)

output_format_arrow_date_as_uint16

Escribe los valores Date como números simples de 16 bits (que se vuelven a leer como UInt16), en lugar de convertirlos en un tipo Arrow DATE32 de 32 bits (que se vuelve a leer como Date32).

output_format_arrow_fixed_string_as_fixed_byte_array

Use el tipo Arrow FIXED_SIZE_BINARY en lugar de Binary para las columnas FixedString.

output_format_arrow_low_cardinality_as_dictionary

Habilita la salida del tipo LowCardinality como tipo Diccionario de Arrow

output_format_arrow_string_as_string

Usar el tipo String de Arrow en lugar de Binary para las columnas String

output_format_arrow_unsupported_types_as_binary

Emite como datos binarios sin procesar los tipos de salida que no tienen conversión. Si es false, esos tipos generarían la excepción UNKNOWN_TYPE.

output_format_arrow_use_64_bit_indexes_for_dictionary

Usa siempre enteros de 64 bits para los índices de diccionario en formato Arrow

output_format_arrow_use_signed_indexes_for_dictionary

Usar enteros con signo para los índices de diccionario en formato Arrow

output_format_avro_codec

Códec de compresión utilizado para la salida. Valores posibles: ‘null’, ‘deflate’, ‘snappy’, ‘zstd’.

output_format_avro_confluent_subject

Para el formato de salida AvroConfluent: el nombre del subject con el que se registra el esquema en Confluent Schema Registry. Obligatorio al escribir en formato AvroConfluent.

output_format_avro_rows_in_file

Número máximo de filas por archivo (si el almacenamiento lo permite)

output_format_avro_string_column_pattern

Para el formato Avro: expresión regular de las columnas String que deben seleccionarse como cadenas AVRO.

output_format_avro_sync_interval

Intervalo de sincronización en bytes.

output_format_binary_encode_types_in_binary_format

Escribe los tipos de datos en formato binario en lugar de los nombres de tipo en el formato de salida RowBinaryWithNamesAndTypes

output_format_binary_write_json_as_string

Escribe valores del tipo de dato JSON como valores JSON de tipo String en el formato de salida RowBinary.

output_format_bson_string_as_string

Utiliza el tipo String de BSON en lugar de Binary para las columnas de tipo String.

output_format_compression_level

Nivel de compresión predeterminado si la salida de la consulta está comprimida. Esta configuración se aplica cuando la consulta SELECT incluye INTO OUTFILE o al escribir en las funciones de tabla file, url, hdfs, s3 o azureBlobStorage. Valores posibles: de 1 a 22

output_format_compression_zstd_window_log

Se puede usar cuando el método de compresión de salida es zstd. Si es mayor que 0, esta configuración establece explícitamente el tamaño de la ventana de compresión (potencia de 2) y habilita un modo de largo alcance para la compresión zstd. Esto puede ayudar a lograr un mejor ratio de compresión. Posibles valores: números no negativos. Tenga en cuenta que, si el valor es demasiado pequeño o demasiado grande, zstdlib lanzará una excepción. Los valores típicos van de 20 (tamaño de la ventana = 1MB) a 30 (tamaño de la ventana = 1GB).

output_format_csv_crlf_end_of_line

Si se establece en true, el fin de línea en formato CSV será \r\n en lugar de \n.

output_format_csv_serialize_tuple_into_separate_columns

Si se establece en true, las tuplas en formato CSV se serializan como columnas separadas (es decir, se pierde su anidamiento dentro de la tupla)

output_format_decimal_trailing_zeros

Muestra los ceros finales al imprimir valores Decimal. P. ej., 1.230000 en lugar de 1.23. Desactivado de forma predeterminada.

output_format_json_array_of_rows

Habilita la salida de todas las filas como un array JSON en el formato JSONEachRow. Valores posibles:

1 — ClickHouse devuelve todas las filas como un array, con cada fila en el formato JSONEachRow.
0 — ClickHouse devuelve cada fila por separado en el formato JSONEachRow.

Ejemplo de una consulta con la configuración habilitada Consulta:

SET output_format_json_array_of_rows = 1;
SELECT number FROM numbers(3) FORMAT JSONEachRow;

Resultado:

[
{"number":"0"},
{"number":"1"},
{"number":"2"}
]

Ejemplo de una consulta con la configuración desactivada Consulta:

SET output_format_json_array_of_rows = 0;
SELECT number FROM numbers(3) FORMAT JSONEachRow;

Resultado:

{"number":"0"}
{"number":"1"}
{"number":"2"}

output_format_json_escape_forward_slashes

Controla el escape de las barras diagonales en la salida de cadenas en el formato de salida JSON. Está pensado para la compatibilidad con JavaScript. No lo confunda con las barras invertidas, que siempre se escapan. Habilitado de forma predeterminada.

output_format_json_map_as_array_of_tuples

Serializa las columnas Map como arrays JSON de tuplas. Desactivado de forma predeterminada.

output_format_json_named_tuples_as_objects

Serializa las columnas de tuplas con nombre como objetos JSON. Está habilitado de forma predeterminada.

output_format_json_pretty_print

Esta configuración determina cómo se muestran las estructuras anidadas, como Tuples, Maps y Arrays, dentro del array data al usar el formato de salida JSON. Por ejemplo, en lugar de esta salida:

"data":
[
  {
    "tuple": {"a":1,"b":2,"c":3},
    "array": [1,2,3],
    "map": {"a":1,"b":2,"c":3}
  }
],

La salida tendrá el siguiente formato:

"data":
[
    {
        "tuple": {
            "a": 1,
            "b": 2,
            "c": 3
        },
        "array": [
            1,
            2,
            3
        ],
        "map": {
            "a": 1,
            "b": 2,
            "c": 3
        }
    }
],

Habilitado de forma predeterminada.

output_format_json_quote_64bit_floats

Controla si los valores Float de 64 bits se encierran entre comillas al generarse en formatos JSON*. Deshabilitado de forma predeterminada.

output_format_json_quote_64bit_integers

Controla si los enteros de 64 bits o mayores (como UInt64 o Int128) se encierran entre comillas cuando se generan en formato JSON. De forma predeterminada, estos enteros se encierran entre comillas. Este comportamiento es compatible con la mayoría de las implementaciones de JavaScript. Valores posibles:

0 — Los enteros se generan sin comillas.
1 — Los enteros se encierran entre comillas.

output_format_json_quote_decimals

Controla si los valores decimales se encierran entre comillas en los formatos de salida JSON. Desactivado de forma predeterminada.

output_format_json_quote_denormals

Permite la salida de +nan, -nan, +inf y -inf en el formato de salida JSON. Valores posibles:

0 — Deshabilitado.
1 — Habilitado.

Ejemplo Considere la siguiente tabla account_orders:

┌─id─┬─name───┬─duration─┬─period─┬─area─┐
│  1 │ Andrew │       20 │      0 │  400 │
│  2 │ John   │       40 │      0 │    0 │
│  3 │ Bob    │       15 │      0 │ -100 │
└────┴────────┴──────────┴────────┴──────┘

Cuando output_format_json_quote_denormals = 0, la consulta devuelve valores null en la salida:

SELECT area/period FROM account_orders FORMAT JSON;

{
        "meta":
        [
                {
                        "name": "divide(area, period)",
                        "type": "Float64"
                }
        ],

        "data":
        [
                {
                        "divide(area, period)": null
                },
                {
                        "divide(area, period)": null
                },
                {
                        "divide(area, period)": null
                }
        ],

        "rows": 3,

        "statistics":
        {
                "elapsed": 0.003648093,
                "rows_read": 3,
                "bytes_read": 24
        }
}

Cuando output_format_json_quote_denormals = 1, la consulta devuelve:

{
        "meta":
        [
                {
                        "name": "divide(area, period)",
                        "type": "Float64"
                }
        ],

        "data":
        [
                {
                        "divide(area, period)": "inf"
                },
                {
                        "divide(area, period)": "-nan"
                },
                {
                        "divide(area, period)": "-inf"
                }
        ],

        "rows": 3,

        "statistics":
        {
                "elapsed": 0.000070241,
                "rows_read": 3,
                "bytes_read": 24
        }
}

output_format_json_skip_null_value_in_named_tuples

Omite los pares clave-valor con valor NULL al serializar columnas de tuplas con nombre como objetos JSON. Solo es válido cuando output_format_json_named_tuples_as_objects es true.

output_format_json_validate_utf8

Controla la validación de las secuencias UTF-8 en los formatos de salida JSON; no afecta a los formatos JSON/JSONCompact/JSONColumnsWithMetadata, ya que estos siempre validan UTF-8. Deshabilitado de forma predeterminada.

output_format_markdown_escape_special_characters

Cuando está habilitada, escapa los caracteres especiales de Markdown. Common Mark define los siguientes caracteres especiales que pueden escaparse mediante :

! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~

Valores posibles:

0 — Desactivar.
1 — Activar.

output_format_msgpack_uuid_representation

Cómo se representa UUID en formato MsgPack.

output_format_native_encode_types_in_binary_format

Escribe tipos de datos en formato binario en lugar de nombres de tipos en el formato de salida Native

output_format_native_use_flattened_dynamic_and_json_serialization

Escribe los datos de las columnas JSON y Dynamic en formato aplanado (todos los tipos y rutas como subcolumnas independientes).

output_format_native_write_json_as_string

Escribe los datos de la columna JSON como una columna String que contiene cadenas JSON, en lugar de usar la serialización JSON nativa predeterminada.

output_format_orc_compression_block_size

El tamaño, en bytes, del bloque de compresión para el formato de salida ORC.

output_format_orc_compression_method

Método de compresión para el formato de salida ORC. Códecs compatibles: lz4, snappy, zlib, zstd, none (sin comprimir)

output_format_orc_dictionary_key_size_threshold

Para una columna de tipo cadena en el formato de salida ORC, si el número de valores distintos es mayor que esta fracción del número total de filas no nulas, se desactiva la codificación por diccionario. En caso contrario, la codificación por diccionario se habilita

output_format_orc_row_index_stride

Paso objetivo del índice de filas en el formato de salida ORC

output_format_orc_string_as_string

Usa el tipo String de ORC en lugar de Binary para las columnas String

output_format_orc_writer_time_zone_name

El nombre de la zona horaria del escritor de ORC; la zona horaria predeterminada del escritor de ORC es GMT.

output_format_parallel_formatting

Habilita o deshabilita el formateo paralelo en los formatos de datos. Solo es compatible con los formatos TSV, TSKV, CSV y JSONEachRow. Valores posibles:

1 — Habilitado.
0 — Deshabilitado.

output_format_parquet_batch_size

Compruebe el tamaño de la página cada esta cantidad de filas. Considere reducirlo si tiene columnas con un tamaño promedio de los valores superior a unos pocos KB.

output_format_parquet_bloom_filter_bits_per_value

Número aproximado de bits que se deben usar para cada valor distinto en los filtros bloom de Parquet. Tasas estimadas de falsos positivos:

6 bits - 10%
10.5 bits - 1%
16.9 bits - 0.1%
26.4 bits - 0.01%
41 bits - 0.001%

output_format_parquet_bloom_filter_flush_threshold_bytes

Dónde colocar los filtros bloom en el archivo Parquet. Los filtros bloom se escribirán en grupos de aproximadamente este tamaño. En particular:

si es 0, los filtros bloom de cada grupo de filas se escriben inmediatamente después del grupo de filas;
- si es mayor que el tamaño total de todos los filtros bloom, los filtros bloom de todos los grupos de filas se acumularán en memoria y después se escribirán juntos cerca del final del archivo;
- en caso contrario, los filtros bloom se acumularán en memoria y se escribirán cuando su tamaño total supere este valor.

output_format_parquet_compression_method

Método de compresión para el formato de salida Parquet. Códecs compatibles: snappy, lz4, brotli, zstd, gzip, none (sin comprimir)

output_format_parquet_data_page_size

Tamaño de página objetivo en bytes, antes de la compresión.

output_format_parquet_date_as_uint16

Escribe los valores Date como números simples de 16 bits (se vuelven a leer como UInt16), en lugar de convertirlos a un tipo DATE de Parquet de 32 bits (se vuelve a leer como Date32).

output_format_parquet_datetime_as_uint32

Escribe los valores DateTime como una marca temporal Unix sin convertir (se leen de nuevo como UInt32), en lugar de convertirlos a milisegundos (se leen de nuevo como DateTime64(3)).

output_format_parquet_enum_as_byte_array

Escribe enum con el tipo físico de Parquet: BYTE_ARRAY y el tipo lógico: ENUM

output_format_parquet_fixed_string_as_fixed_byte_array

Utiliza el tipo Parquet FIXED_LEN_BYTE_ARRAY en lugar de Binary para las columnas FixedString.

output_format_parquet_geometadata

Permite escribir información sobre las columnas geoespaciales en los metadatos de Parquet y codificar las columnas en formato WKB.

output_format_parquet_max_dictionary_size

Si el tamaño del diccionario supera esta cantidad de bytes, se cambia a una codificación sin diccionario. Establézcalo en 0 para desactivar la codificación por diccionario.

output_format_parquet_parallel_encoding

Realiza la codificación de Parquet en varios hilos.

output_format_parquet_row_group_size

Tamaño objetivo del grupo de filas, en número de filas.

output_format_parquet_row_group_size_bytes

Tamaño objetivo del grupo de filas en bytes, antes de la compresión.

output_format_parquet_string_as_string

Use el tipo String de Parquet en lugar de Binary para las columnas String.

output_format_parquet_write_bloom_filter

Escribe filtros bloom en archivos Parquet.

output_format_parquet_write_checksums

Escribe sumas de comprobación CRC32 en los encabezados de página de Parquet.

output_format_parquet_write_page_index

Escribe el índice de columna y el índice de offsets (es decir, estadísticas sobre cada página de datos, que pueden usarse para el pushdown de filtros durante la lectura) en archivos parquet.

output_format_pretty_color

Usa secuencias de escape ANSI en los formatos Pretty. 0 - desactivado, 1 - activado, ‘auto’ - activado si la salida es una terminal.

output_format_pretty_display_footer_column_names

Muestra los nombres de las columnas en el pie si hay muchas filas en la tabla. Valores posibles:

0 — No se muestran los nombres de las columnas en el pie.
1 — Los nombres de las columnas se muestran en el pie si el número de filas es mayor o igual que el valor de umbral establecido por output_format_pretty_display_footer_column_names_min_rows (50 de forma predeterminada).

Ejemplo Consulta:

SELECT *, toTypeName(*) FROM (SELECT * FROM system.numbers LIMIT 1000);

Resultado:

      ┌─number─┬─toTypeName(number)─┐
   1. │      0 │ UInt64             │
   2. │      1 │ UInt64             │
   3. │      2 │ UInt64             │
   ...
 999. │    998 │ UInt64             │
1000. │    999 │ UInt64             │
      └─number─┴─toTypeName(number)─┘

output_format_pretty_display_footer_column_names_min_rows

Establece el número mínimo de filas a partir del cual se mostrará un pie con los nombres de las columnas si el ajuste output_format_pretty_display_footer_column_names está habilitado.

output_format_pretty_fallback_to_vertical

Si está habilitada y la tabla es ancha pero corta, el formato Pretty la mostrará igual que el formato Vertical. Consulta output_format_pretty_fallback_to_vertical_max_rows_per_chunk y output_format_pretty_fallback_to_vertical_min_table_width para ajustar en detalle este comportamiento.

output_format_pretty_fallback_to_vertical_max_rows_per_chunk

La conmutación por error al formato Vertical (consulte output_format_pretty_fallback_to_vertical) se activará solo si el número de registros de un fragmento no supera el valor especificado.

output_format_pretty_fallback_to_vertical_min_columns

El cambio al formato Vertical como alternativa (consulte output_format_pretty_fallback_to_vertical) se activará solo si el número de columnas es mayor que el valor especificado.

output_format_pretty_fallback_to_vertical_min_table_width

El cambio al formato Vertical (consulte output_format_pretty_fallback_to_vertical) solo se activará si la suma de las longitudes de las columnas de una tabla alcanza al menos el valor especificado o si al menos un valor contiene un salto de línea.

output_format_pretty_glue_chunks

Si los datos mostrados en formatos Pretty llegan en varios fragmentos, incluso con retraso, pero el siguiente fragmento tiene los mismos anchos de columna que el anterior, use secuencias de escape ANSI para volver a la línea anterior y sobrescribir el pie del fragmento anterior, de modo que continúe con los datos del nuevo fragmento. Esto hace que el resultado sea visualmente más agradable. 0 - deshabilitado, 1 - habilitado, ‘auto’ - habilitado si es un terminal.

output_format_pretty_grid_charset

Juego de caracteres para imprimir los bordes de la cuadrícula. Juegos de caracteres disponibles: ASCII, UTF-8 (predeterminado).

output_format_pretty_highlight_digit_groups

Si está habilitado y la salida se muestra en un terminal, resalta con subrayado cada dígito correspondiente a los miles, millones, etc.

output_format_pretty_highlight_trailing_spaces

Si está habilitada y la salida es un terminal, resalta los espacios finales en gris y con subrayado.

output_format_pretty_max_column_name_width_cut_to

Si el nombre de la columna es demasiado largo, se recortará a esta longitud. La columna se recortará si supera output_format_pretty_max_column_name_width_cut_to más output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_name_width_min_chars_to_cut

Número mínimo de caracteres que se recortarán si el nombre de la columna es demasiado largo. La columna se recortará si supera output_format_pretty_max_column_name_width_cut_to más output_format_pretty_max_column_name_width_min_chars_to_cut.

output_format_pretty_max_column_pad_width

Ancho máximo de relleno para todos los valores de una columna en los formatos Pretty.

output_format_pretty_max_rows

Límite de filas para los formatos Pretty.

output_format_pretty_max_value_width

Ancho máximo del valor que se mostrará en los formatos Pretty. Si se supera, se recortará. El valor 0 significa que nunca se recorta.

output_format_pretty_max_value_width_apply_for_single_value

Recorta los valores (consulta la configuración output_format_pretty_max_value_width) solo cuando no se trate de un valor individual en un bloque. En caso contrario, se muestra completo, lo que resulta útil para la consulta SHOW CREATE TABLE.

output_format_pretty_multiline_fields

Si está habilitada, los formatos Pretty mostrarán los campos multilínea dentro de las celdas de la tabla, de modo que se conserven sus bordes. Si no, se mostrarán tal cual, lo que puede deformar la tabla (una ventaja de dejar esta opción desactivada es que será más fácil copiar y pegar valores multilínea).

output_format_pretty_named_tuples_as_json

Controla si las tuplas con nombre en formato Pretty se muestran como objetos JSON con formato legible.

output_format_pretty_row_numbers

Agrega números de fila antes de cada fila en el formato de salida Pretty

output_format_pretty_single_large_number_tip_threshold

Muestra un indicador numérico legible a la derecha de la tabla si el bloque consta de un único número que supera este valor (excepto 0)

output_format_pretty_squash_consecutive_ms

Espera hasta el número especificado de milisegundos al siguiente bloque y lo combina con el anterior antes de escribirlo. Esto evita la salida frecuente de bloques demasiado pequeños, pero aun así permite mostrar los datos de forma continua.

output_format_pretty_squash_max_wait_ms

Emite el bloque pendiente en formatos Pretty si ha transcurrido más del número especificado de milisegundos desde la salida anterior.

output_format_protobuf_nullables_with_google_wrappers

Al serializar columnas Nullable con wrappers de Google, serializa los valores predeterminados como wrappers vacíos. Si se desactiva, los valores predeterminados y los valores NULL no se serializan

output_format_schema

La ruta del archivo en el que se guardará el esquema generado automáticamente en los formatos Cap’n Proto o Protobuf.

output_format_sql_insert_include_column_names

Incluir los nombres de las columnas en la consulta INSERT

output_format_sql_insert_max_batch_size

El número máximo de filas en una sola instrucción INSERT.

output_format_sql_insert_quote_names

Poner entre comillas los nombres de las columnas con el carácter ’`‘

output_format_sql_insert_table_name

El nombre de la tabla en la consulta INSERT de salida

output_format_sql_insert_use_replace

Usa la instrucción REPLACE en lugar de INSERT

output_format_trim_fixed_string

Elimina los bytes nulos finales de los valores FixedString en los formatos de salida de texto. Por ejemplo, toFixedString('John', 8) se imprime como John en lugar de John\0\0\0\0.

output_format_tsv_crlf_end_of_line

Si se establece en verdadero, el final de línea en formato TSV será \r\n en lugar de \n.

output_format_values_escape_quote_with_quote

Si es verdadero, se escapa ’ como ”, de lo contrario, se entrecomilla con '

output_format_write_statistics

Escribe estadísticas sobre las filas leídas, los bytes y el tiempo transcurrido en los formatos de salida adecuados. Habilitado de forma predeterminada

precise_float_parsing

Usar un algoritmo de análisis de números de coma flotante más preciso (pero más lento)

schema_inference_hints

La lista de nombres de columnas y tipos que se utilizarán como sugerencias para la inferencia de esquemas en formatos sin esquema. Ejemplo: Consulta:

desc format(JSONEachRow, '{"x" : 1, "y" : "String", "z" : "0.0.0.0" }') settings schema_inference_hints='x UInt8, z IPv4';

Resultado:

x   UInt8
y   Nullable(String)
z   IPv4

Si schema_inference_hints no tiene el formato adecuado, o si hay un error tipográfico, un tipo de dato incorrecto, etc., se ignorará por completo schema_inference_hints.

schema_inference_make_columns_nullable

Controla si los tipos inferidos se convierten en Nullable durante la inferencia de esquema. Valores posibles:

0 - el tipo inferido nunca será Nullable (use input_format_null_as_default para controlar qué hacer con los valores nulos en este caso),
1 - todos los tipos inferidos serán Nullable,
2 o auto - el tipo inferido será Nullable solo si la columna contiene NULL en una muestra analizada durante la inferencia de esquema o si los metadatos del archivo contienen información sobre la nulabilidad de la columna,
3 - la nulabilidad del tipo inferido coincidirá con los metadatos del archivo si el formato la admite (por ejemplo, Parquet); en caso contrario, siempre será Nullable (por ejemplo, CSV).

schema_inference_make_json_columns_nullable

Controla si los tipos JSON inferidos se convierten en Nullable durante la inferencia de esquemas. Si esta configuración está habilitada junto con schema_inference_make_columns_nullable, el tipo JSON inferido será Nullable.

schema_inference_mode

Modo de inferencia de esquemas. ‘default’: se asume que todos los archivos tienen el mismo esquema y que este puede inferirse a partir de cualquier archivo; ‘union’: los archivos pueden tener esquemas diferentes y el esquema resultante debe ser la unión de los esquemas de todos los archivos

show_create_query_identifier_quoting_rule

Configura la regla de entrecomillado de los identificadores en la consulta SHOW CREATE

show_create_query_identifier_quoting_style

Establece el estilo de entrecomillado de los identificadores en la consulta SHOW CREATE

type_json_allow_duplicated_key_with_literal_and_nested_object

Cuando está habilitada, se permite analizar JSON como {"a" : 42, "a" : {"b" : 42}}, en los que alguna clave está duplicada, pero una de ellas es un objeto anidado.

type_json_skip_duplicated_paths

Cuando está habilitado, durante el análisis de un objeto JSON en el tipo JSON, se ignorarán las rutas duplicadas y solo se insertará la primera, en lugar de generar una excepción

type_json_skip_invalid_typed_paths

Cuando está habilitada, los campos con valores que no pueden convertirse al tipo declarado se omiten, en lugar de generar un error, en las columnas de tipo JSON con rutas tipadas. Los campos omitidos se tratan como ausentes y usarán valores predeterminados o NULL según la definición de la ruta tipada. Esta configuración solo se aplica a columnas de tipo JSON (p. ej., JSON(a Int64, b String)) en las que rutas específicas tienen tipos declarados. No se aplica a formatos de entrada JSON normales, como JSONEachRow, al insertar en columnas tipadas normales. Valores posibles:

0 — Deshabilitar (generar un error si hay discrepancia de tipo).
1 — Habilitar (omitir el campo si hay discrepancia de tipo).

type_json_use_partial_match_to_skip_paths_by_regexp

Cuando está habilitado, durante el análisis de un objeto JSON en el tipo JSON, las expresiones regulares especificadas mediante SKIP REGEXP requerirán una coincidencia parcial para omitir una ruta. Cuando está deshabilitado, se requerirá una coincidencia completa.

validate_experimental_and_suspicious_types_inside_nested_types

Valida el uso de tipos experimentales y sospechosos dentro de tipos anidados como Array/Map/Tuple

Última modificación el 10 de junio de 2026

Funciones beta y características experimentalesClickHouse tiene funciones beta y características experimentales. Esta página de documentación explica su definición.

​allow_special_bool_values_inside_variant

​bool_false_representation

​bool_true_representation

​check_conversion_from_numbers_to_enum

​column_names_for_schema_inference

​date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

​date_time_input_format

​date_time_output_format

​date_time_overflow_behavior

​errors_output_format

​format_avro_schema_registry_connection_timeout

​format_avro_schema_registry_receive_timeout

​format_avro_schema_registry_send_timeout

​format_avro_schema_registry_url

​format_binary_max_array_size

​format_binary_max_object_size

​format_binary_max_string_size

​format_capn_proto_enum_comparising_mode

​format_capn_proto_max_message_size

​format_capn_proto_use_autogenerated_schema

​format_csv_allow_double_quotes

​format_csv_allow_single_quotes

​format_csv_delimiter

​format_csv_null_representation

​format_custom_escaping_rule

​format_custom_field_delimiter

​format_custom_result_after_delimiter

​format_custom_result_before_delimiter

​format_custom_row_after_delimiter

​format_custom_row_before_delimiter

​format_custom_row_between_delimiter

​format_display_secrets_in_show_and_select

​format_json_object_each_row_column_for_object_name

​format_protobuf_use_autogenerated_schema

​format_regexp

​format_regexp_escaping_rule

​format_regexp_skip_unmatched

​format_schema

​format_schema_message_name

​format_schema_source

​format_template_resultset

​format_template_resultset_format

​format_template_row

​format_template_row_format

​format_template_rows_between_delimiter

​format_tsv_null_representation

​input_format_allow_errors_num

​input_format_allow_errors_ratio

​input_format_allow_seeks

​input_format_arrow_allow_missing_columns

​input_format_arrow_case_insensitive_column_matching

​input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

​input_format_avro_allow_missing_fields

​input_format_avro_null_as_default

​input_format_binary_decode_types_in_binary_format

​input_format_binary_max_type_complexity

​input_format_binary_read_json_as_string

​input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

​input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

​input_format_column_name_matching_mode

​input_format_connection_handling

​input_format_csv_allow_cr_end_of_line

​input_format_csv_allow_variable_number_of_columns

​input_format_csv_allow_whitespace_or_tab_as_delimiter

​input_format_csv_arrays_as_nested_csv

​input_format_csv_deserialize_separate_columns_into_tuple

​input_format_csv_detect_header

​input_format_csv_empty_as_default

​input_format_csv_enum_as_number

​input_format_csv_skip_first_lines

​input_format_csv_skip_trailing_empty_lines

​input_format_csv_trim_whitespaces

​input_format_csv_try_infer_numbers_from_strings

​input_format_csv_try_infer_strings_from_quoted_tuples

​input_format_csv_use_best_effort_in_schema_inference

​input_format_csv_use_default_on_bad_values

​input_format_custom_allow_variable_number_of_columns

​input_format_custom_detect_header

​input_format_custom_skip_trailing_empty_lines

​input_format_defaults_for_omitted_fields

allow_special_bool_values_inside_variant

bool_false_representation

bool_true_representation

check_conversion_from_numbers_to_enum

column_names_for_schema_inference

date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands

date_time_input_format

date_time_output_format

date_time_overflow_behavior

errors_output_format

format_avro_schema_registry_connection_timeout

format_avro_schema_registry_receive_timeout

format_avro_schema_registry_send_timeout

format_avro_schema_registry_url

format_binary_max_array_size

format_binary_max_object_size

format_binary_max_string_size

format_capn_proto_enum_comparising_mode

format_capn_proto_max_message_size

format_capn_proto_use_autogenerated_schema

format_csv_allow_double_quotes

format_csv_allow_single_quotes

format_csv_delimiter

format_csv_null_representation

format_custom_escaping_rule

format_custom_field_delimiter

format_custom_result_after_delimiter

format_custom_result_before_delimiter

format_custom_row_after_delimiter

format_custom_row_before_delimiter

format_custom_row_between_delimiter

format_display_secrets_in_show_and_select

format_json_object_each_row_column_for_object_name

format_protobuf_use_autogenerated_schema

format_regexp

format_regexp_escaping_rule

format_regexp_skip_unmatched

format_schema

format_schema_message_name

format_schema_source

format_template_resultset

format_template_resultset_format

format_template_row

format_template_row_format

format_template_rows_between_delimiter

format_tsv_null_representation

input_format_allow_errors_num

input_format_allow_errors_ratio

input_format_allow_seeks

input_format_arrow_allow_missing_columns

input_format_arrow_case_insensitive_column_matching

input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference

input_format_avro_allow_missing_fields

input_format_avro_null_as_default

input_format_binary_decode_types_in_binary_format

input_format_binary_max_type_complexity

input_format_binary_read_json_as_string

input_format_bson_skip_fields_with_unsupported_types_in_schema_inference

input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference

input_format_column_name_matching_mode

input_format_connection_handling

input_format_csv_allow_cr_end_of_line

input_format_csv_allow_variable_number_of_columns

input_format_csv_allow_whitespace_or_tab_as_delimiter

input_format_csv_arrays_as_nested_csv

input_format_csv_deserialize_separate_columns_into_tuple

input_format_csv_detect_header

input_format_csv_empty_as_default

input_format_csv_enum_as_number

input_format_csv_skip_first_lines

input_format_csv_skip_trailing_empty_lines

input_format_csv_trim_whitespaces

input_format_csv_try_infer_numbers_from_strings

input_format_csv_try_infer_strings_from_quoted_tuples

input_format_csv_use_best_effort_in_schema_inference

input_format_csv_use_default_on_bad_values

input_format_custom_allow_variable_number_of_columns

input_format_custom_detect_header

input_format_custom_skip_trailing_empty_lines

input_format_defaults_for_omitted_fields