Saltar al contenido principal

lanzamiento de ClickHouse 26.4, 2026-04-30. Presentación, Vídeo

Cambio incompatible con versiones anteriores

  • El operador IN ahora usa una semántica de valores exactos para el tipo Bool: solo los valores 0 y 1 del conjunto coinciden con valores Bool. Antes, los valores numéricos mayores que 255 en el conjunto IN se truncaban incorrectamente a true al compararse con Bool, por lo que SELECT CAST(1, 'Bool') IN (256) devolvía 1. Ahora devuelve correctamente 0. Cierra #92980. #93115 (Ashrith Bandla).
  • La biblioteca H3 se ha actualizado a la v4, lo que mejora la precisión de los cálculos de longitud, área y otras métricas. Este cambio es incompatible con versiones anteriores porque los nuevos resultados difieren de los anteriores. #100348 (Alexey Milovidov).
  • Ya no se permite usar SELECT como identificador sin comillas en un elemento de la lista de expresiones WITH. #101059 (Aruj Bansal).
  • Este parche cambia cómo la tabla Merge manejará las columnas virtuales. Si la tabla subyacente contiene _table o _database, estas columnas se leerán desde el almacenamiento; de lo contrario, se rellenarán después del paso de lectura mediante el paso de expresión. #101742 (Mikhail Artemenko).
  • El operador IN ahora también rechaza conversiones de Decimal con pérdida dentro de tipos compuestos (Tuple, Array, Map), lo que hace que su comportamiento sea coherente con el de las comparaciones escalares de nivel superior. Antes, las comprobaciones de precisión solo se aplicaban a los valores escalares de nivel superior: por ejemplo, CAST('33.3', 'Decimal64(1)') IN (33.33) devolvía correctamente 0, pero CAST(['33.3'], 'Array(Decimal64(1))') IN ([33.33]) devolvía incorrectamente 1 porque la conversión con pérdida se producía dentro de un Array. Ahora ambos casos devuelven correctamente 0. #101812 (Nihal Z. Miaji).
  • Se redujo el valor predeterminado de http_max_fields de 1,000,000 a 1,000 y el de http_max_field_name_size de 128 KB a 4 KB para limitar el uso de memoria previo a la autenticación de las conexiones HTTP. Se añadieron los ajustes http_max_request_header_size y http_headers_read_timeout. Los usuarios que dependan de los límites anteriores más altos pueden restaurarlos mediante ajustes. #103285 (Sema Checherinda).

Nueva funcionalidad

  • Se añade el volcado automático a disco a los hash join y parallel hash join, convirtiéndolos en grace hash join cuando se alcanza el límite de memoria. Este comportamiento se controla con max_bytes_before_external_join. #97813 (János Benjamin Antal).
  • Se añade soporte para Arrow Flight SQL. #91170 (Yakov Olkhovskiy).
  • Agregar compatibilidad con lectura incremental para los motores de tabla Paimon, con seguimiento del progreso de snapshots respaldado por Keeper, incluidas lecturas delta dirigidas de snapshots mediante paimon_target_snapshot_id, y ampliar la cobertura de pruebas para la correspondencia de tipos, la poda de particiones y los escenarios de lectura incremental. #93655 (XiaoBinMu).
  • La función stem ha dejado de ser experimental (anteriormente, era necesario habilitar la configuración allow_experimental_nlp_functions). #102399 (Jimmy Aguilar Mena). Ahora puede aplicar fácilmente stemming a todas las palabras/tokens de las columnas String, FixedString, Array([Fixed]String), Nullable, LowCardinality y Const con la función stem. #99137 (Jimmy Aguilar Mena).
  • Se implementa el nuevo comportamiento de max_insert_block_size_rows, max_insert_block_size_bytes, min_insert_block_size_rows, min_insert_block_size_bytes en el squashing con la configuración de compatibilidad use_strict_insert_block_limits. #94207 (Kirill Kopnev).
  • Se añade la función arrayAutocorrelation(arr [, max_lag]), que calcula la autocorrelación normalizada de un arreglo numérico para cada valor de retraso. Admite arreglos de tipo entero, Float y Decimal. #94776 (Wenyu Chen).
  • Una función SQL obfuscateQuery. Cierra el issue #98010. #98305 (Xuewei Wang).
  • Se añadió compatibilidad con los tipos Map y JSON/Object como atributos de diccionario. Ahora los diccionarios pueden almacenar y recuperar tipos complejos, incluidos Map(String, String), Map(String, Array(String)), JSON y Nullable(JSON), tanto en los layouts FLAT como HASHED. #98627 (yanglongwei).
  • Se añadieron dos nuevos ajustes de MergeTree — replicated_fetches_min_part_level y replicated_fetches_min_part_level_timeout_seconds — que permiten a las réplicas evitar recuperar partes recién insertadas (sin fusionar) de otras réplicas, lo que reduce la sobrecarga de la replicación durante periodos de ingestión intensiva. #98625 (tanner-bruce).
  • Añade soporte para índices de omisión de MergeTree en columnas JSON mediante JSONAllPaths con los tipos de índice bloom_filter, tokenbf_v1, ngrambf_v1 y text (invertido), lo que permite omitir gránulos según el conjunto de rutas JSON presentes en cada gránulo. #98886 (Pavel Kruglov).
  • La función printf ahora admite cadenas de formato no constantes, lo que permite usar distintos formatos por fila según los valores de las columnas. #98991 (Yash ).
  • Se añade un nuevo índice de proyección, commit_order, que reorganiza los datos en orden de inserción. #99004 (Mikhail Artemenko).
  • Se añade la función highlight, que envuelve las apariciones de términos de búsqueda en una cadena de texto con etiquetas HTML (por defecto, <em>/</em>). Admite coincidencias ASCII sin distinción entre mayúsculas y minúsculas, la fusión automática de coincidencias superpuestas y etiquetas de apertura y cierre personalizadas. #99131 (Peng).
  • Implementa cuotas basadas en el hash de la consulta normalizada para proteger los servicios públicos de ClickHouse frente a abusos. 1. Añade compatibilidad con NORMALIZED_QUERY_HASH como tipo de clave de cuota: buckets de cuota separados para cada consulta normalizada única, de modo que CREATE QUOTA q KEYED BY normalized_query_hash realiza un seguimiento independiente de cada consulta distinta. 2. Añade compatibilidad con QUERIES_PER_NORMALIZED_HASH como tipo de recurso de cuota — limita el número máximo de ejecuciones de una misma consulta normalizada dentro de un intervalo, de modo que MAX queries_per_normalized_hash = 100 evita que un mismo patrón de consulta se ejecute más de 100 veces. #99586 (Alexey Milovidov).
  • Ahora, los usuarios pueden escribir consultas con la sintaxis NATURAL JOIN, que hace coincidir automáticamente todas las columnas con el mismo nombre y evita duplicarlas en el resultado. #99840 (Peter Nguyen).
  • Se admite SET TIME ZONE 'tz' como alias de SET session_timezone. #99883 (phulv94).
  • Se añadió soporte para consultas parametrizadas en la interfaz web (play.html): se detectan parámetros de consulta como {name:Type} y se muestran campos de entrada para introducir sus valores. #100041 (Alexey Milovidov).
  • Permite usar la cláusula estándar SQL VALUES como expresión de tabla en FROM, p. ej. SELECT * FROM (VALUES (1, 'a'), (2, 'b')) AS t(id, val). #100143 (Desel72).
  • Se añaden unidades compatibles con PostgreSQL al operador EXTRACT: EPOCH, DOW, DOY, ISODOW, ISOYEAR, WEEK, CENTURY, DECADE, MILLENNIUM. También se corrige EXTRACT(WEEK FROM date), que antes generaba un error. #100274 (Alexey Milovidov).
  • Se añadió compatibilidad con literales compuestos de intervalos según el estándar SQL con calificadores de rango TO, p. ej., INTERVAL '1:30' HOUR TO MINUTE. Internamente, se descomponen en sumas de intervalos. #100453 (Desel72).
  • Añade métricas asíncronas para la memoria de los búferes TCP de recepción y envío del kernel (sk_rmem_alloc, sk_wmem_alloc) de los sockets del pool de conexiones HTTP, notificadas como percentiles p50/p75/p90/p95 y totales por grupo de conexiones. #100575 (Sema Checherinda).
  • Se añadió una web UI para el profiling de jemalloc en ClickHouse Keeper, disponible en /jemalloc en el puerto de control HTTP. #100606 (murphy-4o).
  • Se implementó el comando SYSTEM FLUSH OBJECT STORAGE QUEUE db.table PATH 'x' para los modos ordered y unordered. #100709 (Bharat Nallan).
  • Se añadió la función JSONAllValues, que devuelve todos los valores de una columna JSON como Array(String), con los valores serializados en representación textual y ordenados por sus nombres de ruta. Se añadió compatibilidad con el índice de texto para la expresión JSONAllValues en columnas JSON. Cuando se crea un índice de texto en JSONAllValues(json_column), se utiliza automáticamente para filtrar consultas sobre subcolumnas JSON (p. ej., json_column.key1 = 'value'). #100730 (Anton Popov).
  • Añade una nueva opción de configuración, input_format_column_name_matching_mode, que permite distintos modos de distinguir entre mayúsculas y minúsculas en los formatos de entrada. #99346 (manerone).
  • Se añade el comando watch a clickhouse-keeper-client, con compatibilidad con watch en los comandos get, exists y ls. #100834 (Den Kalantaevskii).
  • Se añadió la solicitud getChildrenRecursive (ListRecursive) a ClickHouse Keeper y el comando lsr a clickhouse-keeper-client. Esto cierra #99916. #100998 (Konstantin Vedernikov).
  • Añade la nueva función arrayTranspose, que toma un array bidimensional (matriz) y lo transpone: SELECT arrayTranspose([[1, 2, 3], [4, 5, 6]]). #101214 (Vitaly Baranov).
  • La configuración auto_statistics_types mergetree tiene como valor predeterminado 'minmax, uniq' — las estadísticas minmax y uniq se crean automáticamente para todas las columnas adecuadas de las tablas nuevas - materialize_statistics_on_insert tiene como valor predeterminado false — las estadísticas ahora se generan durante las fusiones en lugar de en el momento de la inserción, lo que reduce la sobrecarga de inserción. use SET materialize_statistics_on_insert = 1 para restaurar el comportamiento anterior. #101275 (Han Fei).
  • Añade la opción de refresh prefer_dependency_replica para las cadenas de dependencias de vistas materializadas, a fin de reducir la pérdida de datos causada por el retraso de replicación entre réplicas. #101591 (Seva Potapov).
  • Añade la función hasPhrase (alias matchPhrase) para la búsqueda de frases (secuencias continuas de tokens). La búsqueda se realiza por fuerza bruta; es decir, el índice de texto aún no la admite. #101997 (Elmi Ahmadov).
  • Añade las métricas de histograma s3_read_request_duration_microseconds y s3_read_request_bytes para observar el tiempo de vida de la conexión de las solicitudes GET de S3 y los bytes consumidos, visibles en system.histogram_metrics y en el endpoint de Prometheus. #102058 (Sema Checherinda).
  • Los valores Date y Date32 ahora se pueden sumar a los valores Time y Time64 mediante el operador +, lo que da como resultado un DateTime o DateTime64. Por ejemplo, SELECT toDate('2024-01-15') + toTime('14:30:25') devuelve 2024-01-15 14:30:25. El resultado se calcula en la zona horaria de la sesión, y los resultados fuera de rango se tratan según la configuración date_time_overflow_behavior. Cierra #95914. #102421 (Nihal Z. Miaji).
  • El índice de texto ahora es GA y permanece habilitado independientemente del ajuste compatibility, lo que evita que se deshabilite de forma inesperada durante las restauraciones desde copias de seguridad o al ejecutarse en modo de compatibilidad. #101518 (Nikita Fomichev).

funcionalidad experimental

  • Se añadió ALTER TABLE ... EXECUTE remove_orphan_files para tablas Iceberg, con el fin de identificar y eliminar archivos no referenciados del almacenamiento de objetos. #99127 (murphy-4o).
  • Se añadió la opción de configuración query_plan_optimize_join_order_randomize, que aleatoriza las estadísticas usadas para reordenar joins, lo que resulta útil para pruebas. #100643 (Vladimir Cherkasov).
  • Se añadió compatibilidad con funciones de IA en ClickHouse, lo que permite a los usuarios llamar a endpoints de OpenAI y Anthropic mediante SQL. aiGenerate se incluye como la primera función de este tipo. #100831 (George Larionov).
  • Se añadieron funciones de IA: aiClassify, aiExtract y aiTranslate, para aprovechar las API de LLM en ClickHouse. #100832 (George Larionov).
  • Se añadió system.histogram_metric_log, una nueva tabla del sistema que toma periódicamente instantáneas de todas las métricas de histograma (p. ej., latencias de S3/Azure y duraciones de las etapas de procesamiento de solicitudes de Keeper). Además, la columna value de system.histogram_metrics pasa a ser Float64, ya que es más flexible y compatible con el modelo de datos de Prometheus. #103046 (Miсhael Stetsyuk). Es probable que la estructura de la tabla cambie en futuras versiones.

Mejora del rendimiento

  • ClickHouse ahora puede descartar partes de datos completas en las consultas SELECT basándose en estadísticas mín./máx. #94140 (zoomxi).
  • Reducir la contención por bloqueos durante las operaciones de solo lectura en tablas ReplicatedMergeTree con mutaciones completadas. #95771 (Eduard Karacharov).
  • Se respeta optimize_read_in_order al leer proyecciones. Cierra #89453. #95885 (Andrey Zvonov).
  • Pequeñas mejoras en Hash Join y Concurrent Hash Join. #96663 (Yarik Briukhovetskyi).
  • Optimiza la transformación DISTINCT deshabilitando la optimización de columnas LowCardinality cuando los datos de entrada son casi todos distintos. #97113 (Nihal Z. Miaji).
  • Optimización del rendimiento para las consultas con LIKE de #97723. Ahora estas consultas pueden usar índices de texto. #98149 (Elmi Ahmadov).
  • Las funciones matemáticas vectorizadas (exp, log, sigmoid, tanh) ahora están aceleradas en AArch64 (mediante NEON/SVE) y en FreeBSD/Darwin, donde antes usaban un fallback escalar más lento. #98230 (Raúl Marín).
  • Las consultas que filtran por columnas de la clave primaria de MergeTree con alternancias en expresiones regulares sobre cadenas literales, como ^(abc-1|abc-2), ahora pueden usar la poda de la clave primaria cuando las alternativas comparten un prefijo común. #98988 (Yash ).
  • Se generaliza el filtrado dinámico top-k de ORDER BY ... LIMIT para admitir los tipos Nullable, String y COLLATE. #99033 (murphy-4o).
  • Se aceleró el hash join con claves Int32 y Int64 de rango pequeño mediante el uso de una tabla hash de índice directo. #99275 (Hechem Selmi).
  • Consultas discontinuas más rápidas para columnas LowCardinality con un único diccionario. #99285 (Ivan Babrou).
  • Se aceleran las funciones var*Stable y stddev*Stable para columnas Float64 al desvirtualizar el bucle interno. Nota: esto permite optimizaciones del compilador (FMA/registros) que alteran los resultados de coma flotante a nivel de ULP. #99460 (Riyane El Qoqui).
  • Usar la codificación base58 optimizada de Firedancer para entradas de 32/64 bytes (automática para base58Encode). Permitir la decodificación base58 optimizada si el resultado de la decodificación es de 32/64 bytes (de forma explícita con base58Decode('...', 32) o similar). #99461 (Joanna Hulboj).
  • Se habilitan optimizaciones basadas en secciones del enlazador (-ffunction-sections, -fdata-sections, --icf=all) para reducir el tamaño del binario y mejorar el aprovechamiento de la caché de instrucciones. #99474 (Alexey Milovidov).
  • Corrige el escalado negativo en consultas cortas con agregación en máquinas con muchos núcleos. Cuando una consulta lee pocas marcas, el pipeline ya no se expande hasta max_threads después de la agregación, lo que evita la sobrecarga de streams prácticamente vacíos. #99493 (Alexey Milovidov).
  • Mejora el rendimiento de las consultas con réplicas paralelas seleccionando adecuadamente el tamaño de la tarea de lectura. #99801 (Nikita Taranov).
  • Permitir la precarga al leer un archivo remoto mediante la caché de páginas en espacio de usuario. #99919 (Alexey Milovidov).
  • Evitar el cálculo innecesario de la subcolumna .size de String al enumerar subcolumnas. #99941 (Pavel Kruglov).
  • Hacer que la barra de progreso de clickhouse-client sea menos inestable al trabajar desde un hotel con clústeres que tienen un número muy elevado de réplicas. #100145 (Alexey Milovidov).
  • Iniciar MemoryWorker en clickhouse-local cuando la caché de páginas esté habilitada, para que la caché de páginas de espacio de usuario pueda utilizarse realmente. #100306 (Alexey Milovidov).
  • Optimiza las consultas aplicando la cláusula LIMIT dentro de UNION ALL. #100364 (Alexey Milovidov).
  • Se añade compatibilidad con compilación JIT para comparaciones de columnas String y FixedString en ORDER BY, lo que mejora entre un 6 y un 17 % el rendimiento de la ordenación en la fase de merge para claves de ordenación con predominio de cadenas. En coautoría con @lgbo-ustc. #100577 (Raúl Marín).
  • Cuando read_in_order_use_virtual_row está habilitado junto con la nueva configuración read_in_order_use_virtual_row_per_block, ahora se emite información sobre los límites de las filas virtuales después de cada bloque leído de MergeTree, lo que permite que el proceso de mezcla vuelva a priorizar las fuentes a mitad del flujo para las partes cuyos datos quedan completamente filtrados por WHERE/PREWHERE/JOIN. Cierra #99945. #100603 (Vladimir Cherkasov).
  • Conversión más rápida de Float a String para valores enteros grandes al extender la vía rápida de itoa con redondeo compatible con dragonbox. #100649 (Raúl Marín).
  • Sustituye dragonbox por zmij para lograr una conversión de Float a String entre 1.5x y 3x más rápida. #100650 (Raúl Marín).
  • Conversión más rápida de Int128/UInt128 a cadena mediante la sustitución de la división por software por la reducción de Barrett y el desenrollado del bucle de conversión. #100671 (Raúl Marín).
  • Evita generar hilos redundantes en la fusión paralela de uniqExact. #100686 (Jiebin Sun).
  • Se añade la fusión paralela por lotes para uniqExact. #100687 (Jiebin Sun).
  • Mejor paralelización de consultas con vistas simples (con una tabla MergeTree subyacente) ejecutadas con réplicas paralelas. #100815 (Igor Nikonov).
  • Implementa compatibilidad con réplicas paralelas en vistas simples (incluidas las vistas UNION ALL compatibles sobre tablas MergeTree) cuando parallel_replicas_allow_view_over_mergetree=1. Esto permite paralelizar la consulta externa de la vista en lugar de la interna, lo que aumenta la paralelización de consultas entre nodos. #100958 (Igor Nikonov).
  • Optimizar la lectura en el orden de la clave primaria para full_sorting_merge cuando hay filtros con IN en el plan de consulta. #101261 (Nikita Taranov).
  • Optimización de las asignaciones/liberaciones mediante el almacenamiento en caché de la configuración de muestreo, en lugar de recorrer toda la jerarquía del rastreador de memoria. #101267 (Azat Khuzhin).
  • Corrige una regresión significativa en el rendimiento de INSERT cuando deduplicate_insert = 'enable' (predeterminado desde la versión 26.2) al posponer el cálculo del hash de los datos del squashing al sink y usar hashing por lotes de columnas mediante updateHashWithValueRange, lo que reduce la sobrecarga de ~2.5s a ~0.5s para 5M filas con 22 columnas. #101494 (Sema Checherinda).
  • Reduce la sobrecarga del perfilado de bloqueos usando try_lock para evitar medir el tiempo de las adquisiciones sin contención y eliminar la medición del tiempo de retención. #101502 (Antonio Andelic).
  • Se sustituyeron las intrínsecas AVX-512 escritas a mano en arrayDotProduct por bucles autovectorizables independientes de la plataforma, añadiendo compatibilidad con AVX2 y ARM NEON. #101571 (Peng).
  • Mejora el rendimiento de INSERT VALUES para las columnas Map, Array y Tuple cuando los valores se pasan como cadenas escapadas (p. ej., '{\'key\':1}'), evitando recurrir innecesariamente al analizador de expresiones SQL. #102119 (Joanna Hulboj).
  • Se corrigió el uso excesivo de CPU del motor de tabla RabbitMQ. #102711 (Jaap Elst).
  • El optimizador del orden de JOIN ahora infiere predicados transitivos de equi-join a partir de las condiciones JOIN existentes. Por ejemplo, dado A.x = B.x AND B.x = C.x, se reconoce la equivalencia A.x = C.x, lo que permite al optimizador considerar joins directos entre tablas conectadas de forma transitiva. Esto puede mejorar la calidad del plan en esquemas en estrella y en copo de nieve, donde las tablas de dimensiones se conectan a través de una tabla de hechos compartida. Esta funcionalidad se controla mediante la nueva configuración enable_join_transitive_predicates (desactivada de forma predeterminada). #98479 (Alexander Gololobov).
  • Optimiza TRUNCATE DATABASE TABLES LIKE al cancelar previamente las operaciones de merge en paralelo. #98597 (Shaohua Wang).
  • Se añade compatibilidad con la monotonicidad en la multiplicación, lo que permite la poda por clave primaria en expresiones key * constant. #98983 (Amos Bird).
  • Los diccionarios de caché ya no adquieren un bloqueo exclusivo en hasKeys; esto reduce la contención de bloqueos al usar un bloqueo compartido para las lecturas de la caché. #100796 (liuguangliang).
  • Incorporar en línea la subconsulta VIEW en el árbol de consulta para permitir aplicar más optimizaciones a la VIEW. #100830 (Dmitry Novik).
  • Optimizar la carga de la caché al arrancar el servidor. #101500 (Kseniia Sumarokova).
  • Implementar la materialización diferida de columnas para ReplacingMergeTree con FINAL cuando el predicado sea lo bastante selectivo. #101647 (Nikolai Kochetov).
  • Se reactiva la optimización optimize_rewrite_array_exists_to_has (desactivada de forma predeterminada desde la versión 23.10). Reescribe arrayExists(x -> x = elem, arr) como la mucho más rápida has(arr, elem) y ahora omite correctamente la reescritura cuando el tipo de elemento del array y elem no son compatibles para has (p. ej., Date y String), por lo que las consultas que antes fallaban siguen funcionando. Cierra #71431. #100944 (Alexey Milovidov).

Mejora

  • Salida mejorada de EXPLAIN PLAN pretty=1: imprime las columnas de salida de la consulta de nivel superior, muestra las etiquetas/símbolos de la relación de join junto con las filas estimadas del resultado y la localidad, e incluye las columnas de salida de cada paso para los pasos de join/source. Los cambios abarcan la parte de Information Deficit de #98117. #99462 (Kirill Kopnev).
  • Añade la configuración de tabla MergeTree share_nested_offsets (valor predeterminado: true). Cuando se establece en false, las columnas Array con nombres con puntos (p. ej., n.a, n.b) se tratan como columnas independientes, en lugar de compartir archivos de desplazamiento y validar que los arrays tengan el mismo tamaño como parte de la semántica heredada de Nested. #98416 (Amos Bird).
  • Ahora, los usuarios pueden especificar varios métodos de autenticación en el archivo de configuración users.xml/yaml (en SQL, esto siempre fue posible). #91998 (Flip-Liquid).
  • Recarga automática de las conexiones entre nodos de Raft que usan TLS. #93455 (Evgeny).
  • Se amplía cast_keep_nullable para que funcione con tipos Dynamic/JSON. Cuando está habilitado, convertir NULL desde tipos que pueden ser Nullable devolverá NULL; de lo contrario, NULL provocará el error CANNOT_INSERT_NULL_IN_ORDINARY_COLUMN. #96504 (Seva Potapov).
  • Se redujo la huella de memoria de las estructuras de datos internas (objetos ISerialization) gracias a la incorporación de un grupo de objetos. #96563 (Nikita Mikhaylov).
  • Se añade compatibilidad con los campos password e identity en la configuración XML de keeper-client. #96800 (Grigorii Sokolik).
  • Mejora de las escrituras de Iceberg para Unity Catalog. #98162 (Konstantin Vedernikov).
  • Añade la opción de configuración finalize_projection_parts_synchronously para permitir la finalización síncrona de las partes de proyección durante INSERT, lo que reduce el pico de uso de memoria en tablas con muchas proyecciones, mientras mantiene por defecto el comportamiento asíncrono existente. #98228 (Amos Bird).
  • Agregar la columna projections_duration_ms a system.part_log, que registra la duración en milisegundos de la fusión/reconstrucción de cada proyección. #98292 (Amos Bird).
  • Mejora en la cancelación de consultas mediante ExpressionTransform y NumbersRangedSource con KILL QUERY y «cancel query» (Ctrl+C) en clickhouse-client. #98908 (Roman Vasin).
  • Reemplaza la lista source_table_engines codificada de forma fija por una consulta en tiempo de ejecución mediante StorageFactory::getAllStorages(). Esto añade comprobaciones de acceso para algunos motores de tabla que faltaban y cierra #71544. #98984 (pufit).
  • Añade un ajuste para controlar el comportamiento ante incompatibilidades de tipo en Variant y Dynamic (throw o devolver null). #99085 (Bharat Nallan).
  • Mejorar la compatibilidad entre Iceberg y Spark: corregir el manejo inconsistente de rutas causado por el uso combinado de rutas de almacenamiento y rutas de metadata; exigir que las tablas Iceberg escriban una ubicación de tabla que sea una URL o una ruta absoluta; añadir un fallback para calcular el tamaño de los archivos en Azure, ya que algunos lectores de ClickHouse no admiten el conteo de bytes tras el recorrido; manejar version-hint.txt de forma compatible con Spark; introducir abstracciones a nivel de tipos que dificulten mezclar tipos de rutas en el futuro; añadir pruebas para Azure y Local que verifiquen la interoperabilidad entre motores sin carga ni descarga intermedias; corregir el uso de position deletes, que antes dependía de heurísticas de inferencia de rutas cuando ese enfoque no es adecuado. #99163 (Daniil Ivanik). #100420 (Daniil Ivanik).
  • Se corrigió una posible condición de carrera en IPartitionStrategy::cached_result introducida en https://github.com/ClickHouse/ClickHouse/pull/92844. #99400 (Arthur Passos).
  • Los usuarios ahora pueden escribir tipos de datos Interval de ClickHouse en formato Arrow. #99519 (Peter Nguyen).
  • Añade compatibilidad nativa para importar y exportar tipos de datos UUID en los formatos Arrow y Parquet. Los usuarios ahora pueden consultar y transferir directamente datos UUID entre ClickHouse y otras herramientas de datos sin necesidad de realizar conversiones manuales a cadenas ni recurrir a soluciones alternativas. Inferencia lógica automatizada para UUID de nivel superior y compatibilidad con una sugerencia de schema explícita para UUID anidados. #99521 (Ivan).
  • Admite archivos 7z en el almacenamiento de objetos. Cierra #70968. #99600 (Alexey Milovidov).
  • Se añaden los ProfileEvents ObjectStorageListedObjects, ObjectStorageGlobFilteredObjects, ObjectStoragePredicateFilteredObjects y ObjectStorageReadObjects para la introspección del pipeline de listado y lectura de archivos en almacenamiento de objetos (S3, Azure, etc.). #99778 (Sema Checherinda).
  • Se corrige el fallo de la función de tabla merge que provocaba el error UNKNOWN_IDENTIFIER al consultar columnas que no están presentes en todas las tablas distribuidas/remotas subyacentes. #99833 (Alexey Milovidov).
  • Ahora incluimos el tiempo de commit en la métrica del tiempo total de ejecución de las mutaciones para ReplicatedMergeTree. Se había omitido después de #96376. #99936 (alesapin).
  • Se añade un write-ahead log para los objetos blob pendientes de eliminación en MetadataStorageFromDisk, lo que mejora la durabilidad y la coherencia entre los metadatos y el almacenamiento remoto de objetos cuando se eliminan objetos. #100019 (Maksim Kita).
  • Se deshabilitó la generación de SQL con IA (comando ??) en el client embebido (protocolos SSH y WebSocket) para evitar el acceso a las variables de entorno del servidor. #100290 (Alexey Milovidov).
  • Se cambia la interfaz del catálogo para las inserciones de Iceberg. Quedan obsoletas las configuraciones storage_catalog_type, storage_aws_access_key_id, etc. #100334 (Konstantin Vedernikov).
  • Interpretar las tabulaciones como 4 espacios al pegar en clickhouse-client. Cierra #100405. #100416 (Raúl Marín).
  • Evita escanear todo el catálogo remoto del lago de datos para mostrar sugerencias de tablas del tipo “Quizá quiso decir…” cuando show_data_lake_catalogs_in_system_tables está deshabilitado. #100452 (Alsu Giliazova).
  • Aplicar distributed_index_analysis_min_indexes_bytes_to_activate tras la poda de particiones. #100477 (Azat Khuzhin).
  • Se corrige un error de aserción en el pushdown del bloom filter de Parquet al usar cláusulas IN/NOT IN vacías. #100543 (zoomxi).
  • Las estadísticas de columna MinMax ahora almacenan los valores mínimo y máximo como Field (tipado) en lugar de Float64. El formato serializado incluye el nombre del tipo de la columna junto con los valores. La versión del archivo de estadísticas se actualiza a V2; los archivos escritos por versiones anteriores requieren volver a materializarse (ALTER TABLE … MATERIALIZE STATISTICS ALL). corrección #53140. #100605 (Han Fei).
  • Actualizar cppkafka para incluir una corrección del interbloqueo al cerrar el consumidor. #100612 (Azat Khuzhin).
  • La información del objeto que se utiliza para analizar los archivos de datos en Iceberg ahora incluye el número de filas del archivo y su tamaño en bytes, obtenidos del archivo de manifiesto. #100645 (Daniil Ivanik).
  • Se añadió el parámetro de configuración use_separate_cache_arena para poder controlar la separación de la arena de memoria de la caché. #100664 (Seva Potapov).
  • Agrega compatibilidad nativa para importar los tipos de datos StringView y BinaryView de Apache Arrow a columnas String de ClickHouse, lo que mejora la compatibilidad con la ingestión basada en Arrow. #100762 (Ivan).
  • Algunos ajustes del servidor Keeper ahora se recargan en caliente si el archivo de configuración cambia en tiempo de ejecución: max_requests_batch_size, max_requests_batch_bytes_size, max_request_size, quorum_reads. #100773 (Michael Kolupaev).
  • Se incrementan los eventos de perfil MemoryAllocatedWithoutCheck/MemoryAllocatedWithoutCheckBytes en la compilación release. #100899 (Pavel Kruglov).
  • El seguimiento de memoria en Cgroupv2 ahora excluye slab_reclaimable de la memoria del kernel, lo que ofrece una medición más precisa del uso de memoria no recuperable. #100901 (Antonio Andelic).
  • use_partition_pruning = 0 ahora también desactiva la poda del índice MinMax y la optimización de conteo en las columnas de la clave de partición, además de desactivar la poda basada en claves de partición. #100904 (Nihal Z. Miaji).
  • pretty=1 en EXPLAIN [PLAN] ahora muestra las expresiones en un formato legible. #100927 (Kirill Kopnev).
  • accurateCastOrNull y accurateCastOrDefault ahora admiten tipos de destino Tuple, incluidos Tuples anidados con elementos Nullable. Antes, estas funciones rechazaban destinos Tuple porque Tuple no podía estar dentro de Nullable. Cierra #100820. #100942 (Nihal Z. Miaji).
  • Corregir la duplicación de gráficos en la interfaz de Play al cambiar entre los temas claro y oscuro. #101058 (Alexey Milovidov).
  • Actualización de chdig a v26.3.1 (interfaz de perfetto, minigráficos en el resumen para CPU/Memoria/Fusiones/Consultas, system.warnings, búsqueda con regexp en los logs). #101092 (Azat Khuzhin). Actualización de chdig a v26.4.3 (mejoras en perfetto, correcciones para compartir mediante pastila.nl, diferencias de flamegraph, cambio de configuración en tiempo real). #103145 (Azat Khuzhin).
  • Ahora se permite una coma final en la cláusula WITH antes de una consulta SELECT. #101093 (Aruj Bansal).
  • Añade el ajuste de MergeTree compress_per_column_in_compact_parts para controlar cómo se organizan los bloques comprimidos dentro de las partes Compact. Cuando es true (valor predeterminado, que conserva el comportamiento actual), cada columna inicia un nuevo bloque comprimido, lo que permite la descompresión selectiva. Cuando es false, todas las columnas dentro de un gránulo se empaquetan en el mismo bloque comprimido, lo que mejora la relación de compresión y el rendimiento de lectura en cargas de trabajo que siempre leen todas las columnas. #101114 (Amos Bird).
  • Mostrar el tooltip de información de la tabla en la UI de Play solo al pasar el cursor sobre el nombre de la tabla, no sobre toda la fila. #101118 (Alexey Milovidov).
  • Añade iconos específicos para cada motor y mejora la UX de la lista de tablas en la barra lateral de la UI de Play. #101134 (Alexey Milovidov).
  • Compatibilidad con Nullable(Tuple) en los formatos Arrow, ArrowStream, ORC y Parquet heredado. #101272 (Nihal Z. Miaji).
  • Mostrar la fila TOTALS como pie de la tabla en la web UI (play.html). #101286 (Alexey Milovidov).
  • Compatibilidad con el modo multiconsulta en la interfaz web (play.html): ejecución de varias consultas a la vez, con ejecución en paralelo de consultas de tipo SELECT y visualización de resultados por consulta. #101290 (Alexey Milovidov).
  • Se corrige el redimensionamiento de columnas en la interfaz web play.html después de refactorizar la tabla de resultados como un componente web. #101295 (Alexey Milovidov).
  • Se añadió la posibilidad de limitar la cantidad de flushes del perfil de jemalloc en MEMORY_LIMIT_EXCEEDED por intervalo de tiempo. #101396 (Azat Khuzhin).
  • Se añadieron las configuraciones de Keeper nuraft_streaming_mode (valor predeterminado: false), nuraft_max_log_gap_in_stream, nuraft_max_bytes_in_flight_in_stream. Cierra #90743. #101427 (Kseniia Sumarokova).
  • Se añadió la métrica asíncrona CGroupMemoryUsedWithoutPageCache, que informa del uso de memoria del cgroup excluyendo tanto la caché de páginas del kernel del sistema operativo como la caché de páginas en espacio de usuario de ClickHouse, en consonancia con MemoryResidentWithoutPageCache. También se aclaró la descripción de la métrica CGroupMemoryUsed. #101513 (Francesco Ciocchetti).
  • Añade azúcar sintáctico a nivel del analizador sintáctico para la sintaxis de la función OVERLAY del estándar SQL. La función overlay ya existe; esto añade compatibilidad con la forma basada en palabras clave que usa PLACING, FROM y FOR como separadores. #101681 (Desel72).
  • Se añadió el alias de columna INDEX_LENGTH a la tabla del sistema information_schema.tables, en consonancia con los alias existentes en mayúsculas de esta tabla. #101705 (Robert Schulze).
  • La tabla del sistema information_schema.tables ahora ignora las partes inactivas de la tabla. Esto hace que los valores de tamaño de la tabla que se muestran sean más realistas. #101706 (Robert Schulze).
  • La función ngrams ahora rechaza longitudes de ngram no válidas. Ejemplo: SELECT ngrams('abc', 0) ahora devuelve un error. #101922 (Robert Schulze).
  • Como seguimiento de #91820 y #90837: eliminar del mensaje de error los algoritmos no compatibles; ejecutar pruebas específicas de FIPS en compilaciones FIPS. #102067 (Mikhail f. Shiryaev).
  • Limita la altura de las celdas a tres líneas en la Web UI (play.html), con posibilidad de expandirlas al hacer clic. #102154 (Alexey Milovidov).
  • Se añadió una nueva opción que permite forzar el estilo (virtual/path) para los endpoints de S3. Resuelve #82019; #76007. Da continuidad a https://github.com/ClickHouse/ClickHouse/pull/83168. #102378 (Konstantin Vedernikov).
  • La configuración restore_replace_external_engines_to_null ahora también omite la restauración de bases de datos con motores externos (p. ej., DataLakeCatalog, MySQL, PostgreSQL, S3) en lugar de producir un error o iniciar conexiones externas. #102400 (Nikita Fomichev).
  • Se añade soporte para el análisis de índices de texto de la función hasPhrase mediante el modo HINT. #102438 (Elmi Ahmadov).
  • Considerar STATISTICS como solo lectura en ColumnDependency para corregir LOGICAL_ERROR durante MATERIALIZE STATISTICS ALL. #102627 (Konstantin Bogdanov).
  • Crear y poblar system.asynchronous_metric_log en modo keeper-as-server. #102664 (Miсhael Stetsyuk).
  • Se añade la opción de configuración default_system_log_flush_policy.skip_alias_columns para permitir omitir las columnas ALIAS de las tablas de logs del sistema, lo que corrige los logs del sistema respaldados por S3 que rechazan columnas ALIAS. #102669 (Miсhael Stetsyuk).
  • No habilite las estadísticas automáticas para las tablas del sistema. Rara vez pueden aprovecharlas. #102862 (Han Fei).
  • Se admite el tokenizer array para la optimización de LIKE. #102880 (Elmi Ahmadov).
  • Enviar MemoryAllocatedWithoutCheck incluso en compilaciones de producción. #103064 (Azat Khuzhin).
  • Exponer untracked_memory de cada hilo en system.stack_trace. #103065 (Azat Khuzhin).

Corrección de errores (mal funcionamiento visible para el usuario en una versión estable oficial)

  • Se corrige el error Block structure mismatch in stream causado por columnas innecesarias devueltas por la materialización diferida. Soluciona #95191. #96682 (Nikolai Kochetov).
  • Corrige un error lógico en una consulta de política de enmascaramiento de datos al usar ON CLUSTER. #97594 (Bharat Nallan).
  • Se corrige un error al usar Unity Catalog sobre GCS. #98456 (Melvyn Peignon).
  • DataLakeCatalog ahora respeta la configuración http_forbid_headers del servidor al validar la opción auth_header. #98827 (Michael Anastasakis).
  • Se corrigen las llamadas N+1 a HeadObject para globs con expansión entre llaves de S3. #99219 (Konstantin Bogdanov).
  • Validar los cambios de configuración en las consultas CREATE cuando el propio motor también admite parámetros de configuración. #99279 (János Benjamin Antal).
  • Se corrigió un fallo por el que ALTER TABLE UPDATE/DELETE fallaba con el error Missing columns cuando una tabla tiene una columna MATERIALIZED cuya expresión depende de una columna EPHEMERAL. #99281 (Yash ).
  • Las credenciales en las cadenas de conexión de JDBC, ODBC y NATS ahora se enmascaran en los registros de consultas y en la salida de SHOW CREATE, lo que evita la exposición accidental de información confidencial. En las cadenas de conexión con formato URI (p. ej., {scheme}://{user}:{password}@{host}), solo se enmascara la contraseña, mientras que el resto permanece visible para facilitar la depuración. El ajuste nats_token ahora también se enmascara. #99344 (János Benjamin Antal).
  • Corrige el análisis incorrecto de palabras que comienzan con prefijos de meses en el formato DD-month-YYYY por parte de parseDateTimeBestEffort. Cierra #99345. #99350 (Pavel Kruglov).
  • Se corrigió que se ignorara TABLE_UUID_MISMATCH cuando no se usa el analizador. #99380 (Azat Khuzhin).
  • Corrige un error por el que los ajustes explícitos enviados junto con compatibility en la misma solicitud podían ignorarse de forma silenciosa cuando su valor coincidía con el valor predeterminado del servidor. #99402 (Raufs Dunamalijevs).
  • Corrige los casos en los que los números con ceros a la izquierda en la ruta de particionado de Hive producían errores. Corrige #98801. #99458 (Yarik Briukhovetskyi).
  • Se corrige heap-use-after-free cuando se elimina una tabla de forma concurrente mientras hay una consulta de lectura en ejecución (19 casos en CI durante los últimos 90 días). #99483 (Alexey Milovidov).
  • Se corrigió un error en Keeper por el que una solicitud de lectura podía quedarse bloqueada (haciendo que la sesión expirara) si se cerraba una sesión distinta y no relacionada en el mismo servidor justo en un mal momento. #99484 (Michael Kolupaev).
  • Validar la estructura de la columna antes de aplicar parches. #99531 (Seva Potapov).
  • Corrige el fallo de aserción de rows_sources en la fusión vertical cuando SYSTEM STOP/START MERGES se activa y desactiva rápidamente durante la fusión de una tabla con columnas Dynamic. #99532 (Alexey Milovidov).
  • Se corrigió la poda incorrecta de particiones en toWeek(), que provocaba que las consultas con WHERE toWeek(date, mode) = N devolvieran resultados vacíos para las semanas 49-52 en tablas particionadas por toYYYYMM(date). #99542 (Takumi Hara).
  • Se corrige una excepción en funciones que operan con ColumnReplicated con filas no referenciadas producidas por JOIN. #99564 (Hechem Selmi).
  • Corrige un problema por el que CLEAR COLUMN no reconstruía las proyecciones ni reevaluaba las columnas materializadas que dependen de la columna eliminada, lo que podía provocar excepciones o corrupción de datos durante fusiones posteriores. #99565 (Desel72).
  • Se corrigió una excepción (Bad get: has Tuple, actual type String) en ConditionSelectivityEstimator cuando una consulta usa IN con un solo parámetro de consulta escalar (p. ej., WHERE col IN ({p:String})) en una tabla que tiene estadísticas de columna y con use_statistics habilitado. #99614 (Ilya Yatsishin).
  • La parte con proyecciones desconocidas no debe marcarse como perdida para siempre. #99623 (Sema Checherinda).
  • Se corrige una excepción poco frecuente de error lógico durante una fusión vertical cuando SYSTEM STOP MERGES y SYSTEM START MERGES se ejecutan de forma concurrente. #99628 (Desel72).
  • Se corrige una referencia colgante en injectRequiredColumns que provocaba un fallo durante un merge. #99679 (Tuan Pham Anh).
  • Corrige el comportamiento indefinido en el lector del formato Avro al leer valores numéricos que exceden la capacidad del tipo de la columna de destino. Ahora las consultas fallan cuando se producen desbordamientos, en lugar de generar silenciosamente valores incorrectos. #99697 (asyablue22).
  • Se corrige el procesamiento de las comillas de estilo shell en los argumentos de la función de tabla executable. #99794 (Nikita Semenov).
  • Corrige un aborto por falso positivo en NativeReader al deserializar un flujo en formato Native con una discrepancia en el recuento de filas: se cambió de LOGICAL_ERROR a INCORRECT_DATA para que el error se trate como un error de datos en lugar de activar abort() en compilaciones con sanitizador/depuración. #99822 (Rahul Nair).
  • Corregida la interrupción del proceso en la deserialización de la columna Tuple cuando el tipo de serialización en el flujo binario es DETACHED. #99823 (Rahul Nair).
  • Se corrigió la falsa excepción LOGICAL_ERROR durante el redimensionamiento dinámico de la caché del sistema de archivos debido a una condición de carrera en la promoción de la subcola de SLRU. #99850 (Alexey Milovidov).
  • Corregidas las consultas de async insert que mostraban written_rows, read_rows y result_rows en cero en query_log y en la salida del client. #99879 (Sema Checherinda).
  • Corrige la excepción “Bad cast from type X to Y” en KILL QUERY cuando la consulta interna sobre las tablas del sistema devuelve columnas encapsuladas en ColumnConst. #99881 (Alexey Milovidov).
  • Se corrige un error lógico en una subconsulta correlacionada dentro del argumento untuple. #99917 (Vladimir Cherkasov).
  • Corrige una excepción al llamar a right, rightUTF8 u otras funciones de subcadena con una longitud de INT64_MIN (-9223372036854775808), lo que antes provocaba un comportamiento indefinido debido a un desbordamiento de enteros. Ahora las funciones devuelven correctamente el error ARGUMENT_OUT_OF_BOUND. #99934 (Jimmy Aguilar Mena).
  • Ahora ClickHouse debería manejar correctamente las tablas de estilo Spark (donde tenemos la ruta absoluta completa para cada archivo o una ruta relativa a la ruta común de la tabla). Corrige #92348. #99935 (alesapin).
  • Se corrige la excepción “formato AST incoherente” en ALTER TABLE ... MODIFY QUERY con subconsultas anidadas que contienen SETTINGS cuando el propio ALTER también incluye SETTINGS. #99938 (Nikita Mikhaylov).
  • Se revierte #97114 “Mover la estimación de filas en el paso de join antes de la comprobación de que haya 1 hijo” debido a una posible regresión del rendimiento. #99957 (Alexander Gololobov).
  • Corrige un error por el que ClickHouse podía omitir archivos si faltaba el encabezado Content-Length en la respuesta a la solicitud HEAD correspondiente (por ejemplo, debido a la transcodificación descompresiva en GCS). #99971 (Yarik Briukhovetskyi).
  • Corrige un fallo de aserción (excepción en builds de depuración, resultados incorrectos en builds de lanzamiento) al multiplicar estados de agregación de NumericIndexedVector por una constante entera par, provocado por un XOR consigo mismos en bitmaps Roaring con alias en pointwiseAddInplace. #99976 (Desel72).
  • Evitar la excepción Unexpected return type en el pushdown heredado de filtros a través de JOIN USING encadenados cuando los tipos de las claves cambian después de las conversiones de JOIN. #99999 (Alexey Milovidov).
  • Corrige la excepción LOGICAL_ERROR “Tipo de nodo inesperado para la expresión de tabla … se obtuvo IDENTIFIER” cuando se usa una subconsulta escalar dentro de un argumento sin resolver de una función de tabla, p. ej., SELECT * FROM remote('localhost', view(SELECT 2 AS x), concat(x, (SELECT 1))). #100014 (Alexey Milovidov).
  • Se corrigió un fallo de INSERT con VALUES cuando los datos iban seguidos de un comentario SQL al final (-- o /* */) en la línea siguiente. Ahora se omite el comentario en lugar de interpretarlo como otra fila. #100016 (Pratima Patel).
  • Se corrige una excepción en arrayRemove al comparar Tuples con componentes NULL. #100017 (Alexey Milovidov).
  • Se corrige una filtración de datos entre usuarios en system.asynchronous_inserts: cualquier usuario con SELECT sobre la tabla podía ver entradas pendientes de inserción asíncrona de otros usuarios. Ahora las entradas se filtran según el usuario actual, salvo que el usuario tenga el privilegio SHOW_USERS. #100024 (Shaohua Wang).
  • Corrige un caso en el que la conversión de Time64 a UInt64 podía restringir los valores a 24 horas. #100025 (Yarik Briukhovetskyi).
  • Se corrigió un bloqueo del servidor local cuando CREATE DICTIONARY tiene una definición con un valor de lista que contiene una función inexistente. #100036 (Yakov Olkhovskiy).
  • Se corrige un problema que impedía que los formatos CSV y MsgPack analizaran correctamente Nullable(Tuple). Cierra #99753. #100038 (Nihal Z. Miaji).
  • Se corrige el error de CREATE VIEW con UNKNOWN_IDENTIFIER al usar como lado derecho de IN un alias de expresión de función en WITH (por ejemplo, tuple(...)). #100042 (Peng).
  • Se corrigieron las funciones de agregación de series temporales (p. ej., timeSeriesResampleToGridWithStaleness) que fallaban con ILLEGAL_TYPE_OF_ARGUMENT cuando se usaban con initializeAggregation o AggregatingMergeTree en réplicas paralelas. #100053 (Alexey Milovidov).
  • Se corrigió el procesamiento de valores negativos en NumericIndexedVectorDataBSI. #100086 (Daniil Ivanik).
  • Se corrigieron las funciones accurateCastOrDefault y to*OrDefault, que no preservaban el tipo de columna Const para entradas constantes. #100132 (Alexey Milovidov).
  • Los parámetros de consulta omitidos de tipo LowCardinality(Nullable(T)) ahora toman correctamente NULL como valor predeterminado, igual que Nullable(T). #100144 (Denys Melnyk).
  • Se corrige el uso de un valor sin inicializar en StringSearcher.h. #100225 (Konstantin Bogdanov).
  • Permite cancelar subconsultas escalares y otras canalizaciones durante el análisis mediante Ctrl+C. Anteriormente, al pulsar Ctrl+C durante una subconsulta escalar de larga duración no ocurría nada hasta que la subconsulta terminaba. También corrige la barra de progreso y las estadísticas JSON para que informen correctamente de las filas leídas durante la ejecución de subconsultas escalares, tanto en clickhouse-client como en clickhouse-local. En coautoría con @YjyJeff. #100230 (Raúl Marín).
  • Se corrigió una excepción LOGICAL_ERROR en consultas que involucran columnas Dynamic con uniones cruzadas y filtros en tiempo de ejecución, causada por ColumnVariant::filter, que compartía punteros a columnas Variant en lugar de clonarlos en la ruta de optimización hasOnlyNulls. Cierra https://github.com/ClickHouse/ClickHouse/pull/100147. #100234 (Pavel Kruglov).
  • Se corrigió un error en Array de Variant que podía reinterpretar el tipo de dato al llamar a la función arrayFirst/arrayLast. Por ejemplo, antes Array(Variant(Date, Bool)) se convertía en Bool cuando el tipo de variante subyacente real era Date. #100255 (timothygk).
  • Algunos cambios menores en las funciones: las funciones h3 ahora validan mejor los límites; readWKB comprueba los límites de tamaño (una nueva configuración, max_wkb_geometry_elements); las funciones del generador aleatorio limitan el número máximo de iteraciones en sus cálculos. Como seguimiento de #93543. #100270 (Alexey Milovidov).
  • Se corrigió un problema por el que cutURLParameter podía omitir parámetros por error cuando aparecían como subcadenas de otros parámetros. #100280 (Nikita Semenov).
  • Se corrige una excepción cuando la configuración de la ruta del archivo de metadata de Iceberg contiene un byte nulo. #100283 (Alexey Milovidov).
  • Se corrigió el crecimiento cuadrático del número de consultas ejecutadas cuando se usa distributed_index_analysis con predicados que contienen subconsultas IN. #100287 (Anton Popov).
  • Corrige la excepción “Block structure mismatch” al usar GROUP BY ... WITH TOTALS HAVING en combinación con UNION DISTINCT y expresiones Nullable. #100293 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR en estimateCompressionRatio cuando el parámetro block_size_bytes es extremadamente grande. #100298 (Alexey Milovidov).
  • Se corrige la excepción “Inconsistent AST formatting” en compilaciones de depuración al usar GROUP BY CUBE(...) WITH ROLLUP o combinaciones similares. #100376 (Alexey Milovidov).
  • Se corrigió una excepción al crear una vista con alias de columnas y consultas SELECT * o EXCEPT/INTERSECT. #100386 (Alexey Milovidov).
  • Soluciona que DROP TABLE se quede bloqueado indefinidamente en tablas con motor Kafka cuando los consumidores se quedan atascados en un rebalance tras un error de heartbeat. #100388 (Alexey Milovidov).
  • Se corrige la excepción ReadBuffer is canceled. Can't read from it. en las operaciones de copia de seguridad y restauración que usan archivos ZIP. #100400 (Alexey Milovidov).
  • Se corrige la excepción TOO_MANY_ROWS en consultas SELECT count() con max_rows_to_read / force_primary_key cuando los datos están repartidos en varias partes con límites de gránulo no alineados. #100408 (Alexey Milovidov).
  • Se corrige system.completions para filtrar correctamente bases de datos, tablas y columnas según los derechos de acceso en todas las combinaciones de permisos: por tabla, por base de datos y con revocación por columna. #100432 (Shaohua Wang).
  • Se corrige un SEGFAULT en NuRaft debido a una condición de carrera. #100444 (Pablo Marcos).
  • min/max/argMin/argMax ahora tratan los NaN de forma coherente con ORDER BY: los NaN siempre se omiten (solo se devuelven cuando todos los valores son NaN). Antes, los resultados dependían de la posición de los NaN en los datos debido a la semántica de comparación no ordenada de IEEE 754. #100448 (Raúl Marín).
  • Se corrigió un error de copiar y pegar por el que delta_lake_snapshot_end_version, cuando se establecía sin delta_lake_snapshot_start_version, se ignoraba silenciosamente en lugar de generar un error BAD_ARGUMENTS. #100454 (Mohammad Lareb Zafar).
  • StorageRabbitMQ::shutdown no es idempotente (accede incondicionalmente a punteros débiles y luego destruye los punteros compartidos correspondientes), pero ahora se invoca dos veces: una vez en StreamingStorageRegistry y después en DatabaseCatalog. Esta corrección hace que el método sea idempotente y añade comprobaciones defensivas de valores nulos. #100455 (Miсhael Stetsyuk).
  • Se corrigió la excepción LOGICAL_ERROR al usar accurateCastOrNull con el tipo de destino QBit. #100470 (Raufs Dunamalijevs).
  • Se corrigió la excepción LOGICAL_ERROR “Stream … not found” al insertar en una tabla con columnas Array(JSON) anidadas en partes wide con optimize_on_insert=0. #100475 (Pavel Kruglov).
  • Validar las rutas de las entradas de archivo en los metadatos de la copia de seguridad para rechazar secuencias de path traversal, rutas absolutas y nombres vacíos durante RESTORE. #100483 (Pablo Marcos).
  • Se corrige un problema por el que la sintaxis LIMIT m OFFSET n WITH TIES no funcionaba. Esta sintaxis es equivalente a LIMIT n, m WITH TIES, que ya funcionaba. #100491 (Nihal Z. Miaji).
  • Se corrige la excepción “No set is registered for key” al usar IN con columnas Nullable(Tuple) que tienen campos con nombre y elementos LowCardinality. #100523 (Alexey Milovidov).
  • Se corrige un desbordamiento de búfer en el montón en usearch sorted_buffer_gt::insert() que podía provocar un cierre inesperado o corromper silenciosamente la memoria durante la búsqueda por similitud vectorial. #100537 (Dustin Healy).
  • Se corrigió un problema por el que EXECUTE AS ignoraba las cláusulas FORMAT e INTO OUTFILE especificadas en la consulta. #100538 (pufit).
  • Corrige la inconsistencia en el formato del AST para SAMPLE con OFFSET a nivel de consulta. Cierra #100576. #100579 (Pavel Kruglov).
  • Corrige el catálogo Polaris en Azure. Desde la versión 25.12, este catálogo en Azure empezó a añadir el bucket al principio de la ruta. Por ejemplo, abfss://polaris-polaris@<some_url>.windows.net/polaris-polaris/<other-path> en lugar de abfss://polaris-polaris@<some_url>.windows.net/<other-path>. Este PR elimina el bucket de la ruta. #100583 (Konstantin Vedernikov).
  • Corrige la excepción por incompatibilidad de tipos en transform cuando la columna por defecto es const en algunos bloques. Cierra #100574. #100616 (Pavel Kruglov).
  • Corrige los casos de NOT_FOUND_COLUMN_IN_BLOCK en los que la parte SELECT de la proyección contiene columnas que no existen en la parte SELECT original de la consulta. Cierra #100194. #100623 (Yarik Briukhovetskyi).
  • Validar las dimensiones de la forma del formato Npy frente al tamaño del archivo y los límites de desbordamiento para evitar ataques de denegación de servicio mediante archivos .npy especialmente diseñados con dimensiones desmesuradamente grandes. También se rechazan las formas vacías y se limita la memoria por fila a 2 GiB. #100625 (Raúl Marín).
  • Se corrige un problema por el que se ignoraba session_timezone al analizar valores DateTime durante las inserciones asíncronas (TCP) y todas las inserciones a través de HTTP. #100647 (Sema Checherinda).
  • Permitir pasar la clave de segmentación a las funciones de tabla cluster() y clusterAllReplicas() al usar una función de tabla como fuente (p. ej., cluster('name', view(...), sharding_key)). #100665 (Sergey Veletskiy).
  • Se corrige un cierre inesperado del servidor (fallo de aserción) al usar funciones de agregación paramétricas con el combinador Array y argumentos NULL, como quantileIfArrayArray(0.5)([[NULL]], [[1]]). #100679 (nerve-bot).
  • Corrige la excepción al calcular el supertipo común para tuplas vacías y no vacías con use_variant_as_common_type activado. #100699 (Antonio Andelic).
  • El servidor ya no deja de iniciarse cuando se configura un disco de Azure blob storage, pero el endpoint no está accesible temporalmente (p. ej., por un fallo de DNS). #100701 (Raúl Marín).
  • Se corrigió el comportamiento indefinido en positiveModulo cuando el divisor sin signo no cabe en el tipo de resultado con signo. #100705 (Raúl Marín).
  • Se corrige el cierre inesperado del servidor (error lógico “tipo de retorno inesperado de __topKFilter”) cuando use_top_k_dynamic_filtering está habilitado y la columna de ORDER BY es de tipo Dynamic o Variant. #100742 (Groene AI).
  • Corrige un fallo del servidor al usar la función has() con PREWHERE/WHERE en una clave Tuple que contiene elementos LowCardinality. #100760 (Groene AI).
  • Se corrige el error de aserción file_offset_of_buffer_end <= getFileSize() (excepción en compilaciones de depuración) al leer tablas Log o StripeLog en almacenamiento de objetos S3 con escrituras concurrentes. #100763 (Alexey Milovidov).
  • Corrige una excepción en el estimador de selectividad de estadísticas cuando una cláusula WHERE incluye una expresión de función (p. ej., toDecimal64(col, 3)) en una tabla con estadísticas activadas. Ahora, el estimador omite esos predicados en lugar de intentar una conversión de tipos no válida. #100764 (Han Fei).
  • Corrige un caso poco frecuente en el que un join con reordenación puede dar un resultado incorrecto. #100790 (Yarik Briukhovetskyi).
  • Corrige los tipos incorrectos de los argumentos de AggregateFunction en el conteo trivial optimizado, lo que provocaba la excepción NUMBER_OF_ARGUMENTS_DOESNT_MATCH al consultar expresiones como count(v0 + v1) en tablas distribuidas. #100794 (YjyJeff).
  • Algunos catálogos pueden mostrar secretos en la sección SETTINGS del resultado de la consulta select * from system.databases. Este PR evita ese comportamiento. #100800 (Konstantin Vedernikov).
  • Corrige el comportamiento indefinido (desbordamiento de enteros con signo) en toStartOfInterval al usar intervalos de Week, Quarter o Year con el argumento origin y valores extremos del intervalo. #100817 (Raúl Marín).
  • Se corrigen los combinadores de funciones de agregación If, Distinct, DistinctIf, IfState con tipo de retorno Tuple y uno o más argumentos Nullable, que no podían leer estados serializados antiguos tras la introducción de Nullable(Tuple). Cierra #98917. #100826 (Nihal Z. Miaji).
  • Se corrige un segfault en s3Cluster y en las consultas distribuidas debido a un use-after-free en el pool de conexiones. #100837 (Konstantin Bogdanov).
  • Se corrige un segfault por desreferenciación de puntero nulo al cargar diccionarios durante el apagado del servidor. Context::getUserDefinedSQLObjectsStorage (desreferencia user_defined_sql_objects_storage) es invocado por los hilos de diccionario de forma concurrente mientras el hilo principal llama a Context::shutdown (establece user_defined_sql_objects_storage en null). Debemos asegurarnos de deshabilitar futuras actualizaciones en el cargador de diccionarios, terminar las consultas de diccionario que se estén ejecutando en ese momento y esperar a que finalicen los hilos de carga de diccionarios, todo ello antes de ejecutar Context::shutdown. De forma similar a lo que hacemos con las consultas normales. #100839 (Miсhael Stetsyuk).
  • Se corrigió el desbordamiento de búfer en ULIDStringToDateTime cuando la entrada contiene bytes no ASCII. #100843 (Konstantin Bogdanov).
  • Corregido un cierre inesperado (LOGICAL_ERROR) al consultar una tabla Merge (o la table function merge()) que engloba varias tablas, incluida una tabla Distributed, con distributed_group_by_no_merge=1 activado. #100859 (Groene AI).
  • Cast_keep_nullable, cuando está habilitado, no lanzará una excepción al convertir un NULL de Dynamic a Variant. #100864 (Seva Potapov).
  • Se corrige un problema por el que los comandos clickhouse-keeper-client get, exists y ls imprimían mensajes de error duplicados de watch_id en stdout en lugar de stderr. #100893 (Mohammad Lareb Zafar).
  • Corrige una excepción en intDiv/intDivOrZero en arrays de tuplas Nullable, p. ej., SELECT intDiv([divide((1, 2), ... AND NULL)], 2). #100895 (Raúl Marín).
  • Evaluar los argumentos del motor de StorageAlias antes de almacenar la definición, para que expresiones como currentDatabase() se resuelvan como literales antes de guardarse en la base de datos. #100902 (Nikolay Degterinsky).
  • Se corrige processAndOptimizeTextIndexFunctions cuando query_plan_merge_expressions = 0, donde ExpressionStep está directamente sobre ReadFromMergeTree. Corrige #100879. #100909 (Jimmy Aguilar Mena).
  • Se actualizó replxx para incluir la corrección de un acceso fuera de límites en do_complete_line. #100925 (Azat Khuzhin).
  • Se corrigen resultados incorrectos cuando un JOIN con la optimización de segmento por PK usa la caché de condiciones de consulta y algunas partes quedan filtradas por condiciones en caché. #100926 (Groene AI).
  • Se corrigió que divide e intDiv devolvieran ILLEGAL_DIVISION en algunos casos al usarse en expresiones de filtro durante el análisis de índices. #100928 (Nihal Z. Miaji).
  • Se corrigieron los errores “La tabla de destino no existe” en las vistas materializadas con tablas internas durante el arranque asíncrono, causados por un orden incorrecto de las dependencias de inicio. #100946 (Nikolay Degterinsky).
  • Corrige el comportamiento indefinido (desbordamiento de enteros con signo) en parseDateTimeBestEffort al parsear cadenas de fecha y hora con más de 18 dígitos fraccionarios de segundo. #100948 (Vasily Chekalkin).
  • Se corrigió un fallo al usar un índice de búsqueda de texto con una cláusula IN que contiene una subconsulta de tipo Tuple, por ejemplo, WHERE (id, str) IN (SELECT (id, str) FROM ...), o cuando el número de columnas de la subconsulta no coincide con el de la tupla del lado izquierdo de IN. #100959 (Anton Popov).
  • Se corrigió un fallo al crear un diccionario de polígonos a partir de una tabla MergeTree que utiliza serialización dispersa de columnas. #100964 (Anton Popov).
  • Se corrige el error lógico “nodo de acción del árbol de consulta no válido” al usar INTERSECT ALL / UNION ALL con expresiones reducidas a constantes. #100977 (Alexey Milovidov).
  • Se corrige un problema que impedía que la función de agregación sumCountOrDefault con uno o más argumentos Nullable leyera estados serializados antiguos tras la introducción de Nullable(Tuple). Cierra #100882. #101021 (Nihal Z. Miaji).
  • Se corrige un cierre inesperado (Logical error: isConst/isSparse/isReplicated assertTypeEquality) en los algoritmos de merge cuando la replicación diferida de columnas (enable_lazy_columns_replication) genera columnas ColumnReplicated que pasan a canalizaciones de merge-sort con entradas que llegan tarde. #101036 (Groene AI).
  • Se corrige el error incorrecto UNKNOWN_IDENTIFIER cuando se usa el mismo alias para varias expresiones en SELECT; ahora se muestra el error correcto MULTIPLE_EXPRESSIONS_FOR_ALIAS. #101040 (Alexey Milovidov).
  • Corrección de las columnas ALIAS con tipos DateTime/DateTime64 que no aplicaban la conversión de zona horaria cuando la zona horaria declarada difiere de la de la expresión. #101043 (Alexey Milovidov).
  • Se corrige que las políticas de fila no se registraran en query_log para vistas, subconsultas e INSERT ... SELECT. Aunque las políticas de fila se aplicaban durante la planificación de la consulta, no se propagaban de los subplanificadores al planificador principal para su registro. Las políticas de fila (solo para el registro) ahora se mantienen en QueryAccessInfo para que tanto los planificadores como los subplanificadores puedan poblarlas. #101044 (Narasimha Pakeer).
  • Se corrige una excepción en DirectJoinMergeTreeEntity cuando los bloques del pipeline contienen columnas ColumnConst que se combinan con columnas normales. #101046 (Alexey Milovidov).
  • Se corrige un espacio innecesario en el formato del alias de columna en la CTE (WITH t (a, b)WITH t(a, b)). #101049 (Alexey Milovidov).
  • Se corrigieron las funciones de tabla remote/cluster que fallaban con funciones de tabla anidadas como merge cuando el analizador está habilitado. #101055 (Alexey Milovidov).
  • Se corrige un problema por el que OFFSET se aplicaba dos veces en consultas distribuidas cuando prefer_localhost_replica=1, lo que producía menos filas de las esperadas. #101071 (Nihal Z. Miaji).
  • Se corrigió un fallo al usar el formato Regexp con una expresión regular no válida en la configuración format_regexp. #101074 (Nihal Z. Miaji).
  • Corrige el error “Illegal type Decimal64 of start parameter” en las funciones de agregación de series temporales al usar serialize_query_plan=1 con réplicas paralelas. #101083 (Groene AI).
  • Se corrige una excepción en optimizeLazyMaterialization cuando se utiliza una proyección con PREWHERE junto con ORDER BY ... LIMIT. #101115 (Anton Popov).
  • Se corrige el fallo del servidor (SIGABRT) al usar funciones de agregación con el combinador Null de uso exclusivamente interno (p. ej., sumNull, avgNull) y con la configuración aggregate_functions_null_for_empty = 1 habilitada. #101147 (Groene AI).
  • Corrige un uso de memoria después de liberarla en la ruta de escritura de la caché del sistema de archivos que podía provocar lecturas de memoria ya liberada al registrar segmentos de archivo completados (detectado por MemorySanitizer en BuzzHouse). #101161 (Groene AI).
  • Se corrige un cierre inesperado del servidor con “Intento de adjuntar una tabla externa a un Set listo sin elementos explícitos” cuando el análisis distribuido de índices encuentra un predicado GLOBAL IN cuyo Set se creó sin elementos explícitos. #101178 (Groene AI).
  • Se corrigen las funciones de agregación MAX/MIN en columnas Decimal que devolvían resultados incorrectos cuando la compilación JIT está activada (tras alcanzar el umbral de compilación). #101203 (Raúl Marín).
  • Se corrigen las optimizaciones de minmax_count_projection y las optimizaciones triviales de COUNT(*), que quedaban deshabilitadas de forma permanente después de una eliminación ligera, incluso tras haberse fusionado todas las partes con una máscara de eliminación ligera. #101212 (Anton Popov).
  • Corrige un caso que podía provocar el error lógico Having zero bytes, ... en la caché cuando se sobrescribía un objeto remoto entre list y read, lo que antes daba lugar a metadatos de objeto obsoletos. #101219 (Kseniia Sumarokova).
  • Se corrige un cierre inesperado del servidor (LOGICAL_ERROR: Bad cast from ColumnVector to ColumnLowCardinality) al consultar una tabla MergeTree con ORDER BY CAST(lc_column, 'Type'), donde lc_column tiene el tipo LowCardinality. #101220 (Groene AI).
  • Se corrige la limpieza de los nodos de procesamiento obsoletos en S3Queue. #101230 (Kseniia Sumarokova).
  • Se corrigió el UB en mergeTreeAnalyzeIndexes() cuando el argumento optimizations no es válido. #101253 (Azat Khuzhin).
  • Se corrige la excepción Logical error: 'partitions_count > 0' al realizar operaciones consecutivas de ALTER TABLE UPDATE en una tabla Iceberg particionada. #101278 (Desel72).
  • Corrige resultados erróneos en consultas cuando se usa una constante entera grande (p. ej., 256, 2147483648) como predicado booleano en una cláusula WHERE con AND sobre tablas MergeTree. Por ejemplo, SELECT count() FROM t WHERE (2147483648 > b) AND 2147483648 devolvía incorrectamente 0 en lugar de coincidir con todas las filas. #101287 (Groene AI).
  • Se corrige el INSERT SELECT desde un clúster de Delta Lake con ReplicatedMergeTree. #101299 (Konstantin Vedernikov).
  • Se corrigió un fallo que provocaba un cierre inesperado con “Error lógico: lectura desde una CTE materializada antes de la materialización” cuando una subconsulta escalar hace referencia a una cadena de CTE materializadas dependientes entre sí. #101305 (Groene AI).
  • Se corrige una condición de carrera en los datos de storage_id en IStorage::getDependentViewsByColumn. #101385 (Nikolay Degterinsky).
  • Se corrigen el formato y la clonación del AST de BACKUP FROM SNAPSHOT. #101405 (Pablo Marcos).
  • Se corrige el cierre inesperado por LOGICAL_ERROR “Current component is empty” al consultar system.part_moves_between_shards con enforce_keeper_component_tracking habilitado. #101462 (Groene AI).
  • Se corrigió un fallo de segmentación en DataTypeDynamic::create() cuando el fuzzer genera un AST malformado del tipo Dynamic. #101464 (Groene AI).
  • Genera un error cuando se usan la configuración delta_lake_snapshot_version o la configuración de versión de CDF sin DeltaKernel habilitado, en lugar de devolver datos incorrectos en silencio. #101489 (Desel72).
  • Se corrige la excepción NOT_FOUND_COLUMN_IN_BLOCK al usar ARRAY JOIN con JOIN USING y con la configuración analyzer_compatibility_join_using_top_level_identifier habilitada. Cierra #101240. #101507 (Vladimir Cherkasov).
  • Se corrigió el fallo en el bucle de reintento de INSERT de Iceberg cuando la tabla se había creado con iceberg_metadata_file_path y la versión de metadatos de destino ya existía. #101548 (Groene AI).
  • Eliminar Nullable de la columna de resultados en arrayIntersect y funciones relacionadas para evitar discrepancias en la serialización/deserialización. #101569 (George Larionov).
  • Se corrige un cierre inesperado del servidor (LOGICAL_ERROR) al hacer SELECT desde una vista materializada basada en una tabla con engine IcebergLocal. #101577 (Groene AI).
  • Se corrige un mensaje de error incorrecto al llamar a intExp10 con un argumento NaN: mostraba intExp2 en lugar de intExp10. #101582 (Krishna Chaitanya).
  • Se corrige un problema por el que allow_statistics=0 no bloqueaba ALTER TABLE ADD STATISTICS ni ALTER TABLE DROP STATISTICS tras la refactorización en #100288. #101585 (Krishna Chaitanya).
  • Se corrige el error por el que KeeperMap CREATE TABLE fallaba con “Cannot create metadata for table” cuando en nodos de ZooKeeper remanentes de un drop parcial anterior a la versión 25.1 faltaba el nodo drop_lock_version. #101623 (Antonio Andelic).
  • Corrige un posible error lógico al leer las subcolumnas de Map. Cierra #100769. Cierra #101336. #101641 (Pavel Kruglov).
  • Da prioridad a la coincidencia exacta de la subcolumna frente a la coincidencia por prefijo en getSubcolumnData para evitar un posible fallo. Cierra #101271. #101645 (Pavel Kruglov).
  • Se corrige un fallo (LOGICAL_ERROR: “ColumnUnique can’t contain null values”) al comparar una columna LowCardinality con una constante NULL de Variant mientras use_variant_default_implementation_for_comparisons está deshabilitado. #101690 (Groene AI).
  • Qué: Se añadió una comprobación de flujo vacío a Bzip2ReadBuffer para que devuelva EOF en lugar de lanzar UNEXPECTED_END_OF_FILE cuando el flujo interno está vacío. #101691 (ClickGap AI Bot).
  • Qué: Se corrigió la descripción invertida de la columna alterable en system.s3_queue_settings y system.azure_queue_settings: se intercambiaron los significados de 0 y 1 para que coincidan con el comportamiento real del código. #101703 (ClickGap AI Bot).
  • Se corrige un error por el que positiveModulo(tuple, number) se derivaba incorrectamente a la división en lugar de al módulo. #101709 (ClickGap AI Bot).
  • Corrige un fallo al configurar thread_pool_size en un disco con caché. Anteriormente, FileCacheSettings::loadFromConfig() rechazaba thread_pool_size como una configuración desconocida, lo que impedía que el servidor arrancara. Esta configuración es un parámetro válido de IDisk que controla la cantidad de hilos usados en operaciones de copia de disco a disco durante los movimientos de partes en segundo plano. #101712 (Francisco).
  • Se corrigió la creación de diccionarios RANGE_HASHED, que aceptaba silenciosamente un atributo de rango MAX inexistente y usaba una configuración de tipos incorrecta cuando los atributos de rango mínimo y máximo tenían tipos distintos. El error se debía a un fallo de copiar y pegar en buildRangeConfiguration, que buscaba min_attr_name en lugar de max_attr_name para el atributo máximo. #101732 (Yakov Olkhovskiy).
  • Se corrige un fallo de acceso a memoria liberada en el planificador de concesión de CPU cuando el temporizador de espera sobrevive al hilo de trabajo cuyos ProfileEvents::Counters referencia. #101761 (Antonio Andelic).
  • Corrige un error en las funciones arrayLevenshteinDistanceWeighted y arraySimilarity. Cierra el issue #101725. #101767 (Mikhail f. Shiryaev).
  • Se corrige un problema por el que la API de consulta de Prometheus ignoraba los cuerpos de formulario en POST. #101794 (James Cunningham).
  • Se corrigió el escape de excepciones desde el destructor Client::~Client de S3 que provocaba el cierre del servidor. #101798 (Gagan Dhakrey).
  • Corrige un use-after-scope en la deserialización en paralelo de rutas dinámicas del tipo Object, que podía provocar bloqueos al leer tablas con muchas rutas dinámicas. #101823 (Antonio Andelic).
  • Se corrigió una salida incorrecta de la función formatDateTime con el formateador %W bajo ciertas configuraciones de formato (no predeterminadas). #101847 (Robert Schulze).
  • Se corrigió el falso negativo de shouldPatchFunction en SYSTEM INSTRUMENT ADD cuando la cadena de búsqueda aparece por primera vez dentro de un argumento de plantilla del nombre de símbolo desdemangleado. #101885 (Pablo Marcos).
  • Se corrigió la pérdida del registro de UDF cuando la sesión de ZooKeeper expiraba durante una actualización periódica; todas las funciones definidas por el usuario podían quedar no disponibles hasta que una actualización completa se realizara correctamente. #101891 (Nikita Fomichev).
  • Se corrigió la descripción de system.codecs de AES_256_GCM_SIV para que indicara AES-256 en lugar de AES-128. #101917 (Jimmy Aguilar Mena).
  • Se corrige un problema por el que se usaban extremos incorrectos en un índice min-max creado sobre una columna JSON, lo que provocaba un resultado de consulta incorrecto. Cierra #101700. #101918 (Pavel Kruglov).
  • El tokenizador splitByString ahora rechaza las cadenas separadoras vacías. #101928 (Robert Schulze).
  • Se corrigió un problema por el que materialize_skip_indexes_on_merge=false no suprimía los índices de texto (de texto completo) durante la fusión. Anteriormente, solo se suprimían los índices de omisión no textuales (minmax, set, bloom_filter); los índices de texto seguían generándose, lo que desperdiciaba CPU y E/S. #101932 (Groene AI).
  • El tokenizador sparseGrams generó tokens más largos que la longitud máxima especificada (esto se debía a un +2 codificado de forma fija en la implementación). #101934 (Elmi Ahmadov).
  • Se corrigió SIGSEGV en MergeTreeDataPartWriterWide::cancel cuando un constructor de flujo lanza una excepción durante addStreams, dejando una entrada nula en column_streams. #101936 (Antonio Andelic).
  • Corrige una excepción al consultar tablas Merge o Distributed con un índice de texto completo y condiciones de filtro combinadas que mezclan has*Tokens con LIKE cuando query_plan_direct_read_from_text_index está habilitado. #101939 (Jimmy Aguilar Mena).
  • Se corrige un comportamiento indefinido al analizar paquetes de consulta del protocolo nativo con valores de QueryProcessingStage no válidos. #101972 (Raúl Marín).
  • Cerrar la conexión TCP cuando se produzca una excepción durante el análisis inicial de la consulta para evitar leer datos basura de un flujo desincronizado. #101989 (Raúl Marín).
  • Corrige una condición de carrera de SLRU en la caché del sistema de archivos 26.1+, que puede provocar un error lógico en la reserva de espacio. En una compilación de depuración, también puede causar un fallo de aserción: 'Previous state is Evicting, but expected state to be Active while setting Evicting flag for 2c1e3484ecdc6b78a8978fa5b17c5097:0:339 (state: Evicting)'.. #101991 (Kseniia Sumarokova).
  • Se corrige una excepción al convertir una cadena con datos sobrantes al tipo Tuple() vacío. #102011 (Alexey Milovidov).
  • Corrige el orden incorrecto de las filas en las consultas que usan ORDER BY con el algoritmo de join grace_hash. Las consultas afectadas podían devolver resultados en un orden incorrecto, lo que producía una salida incorrecta sin que se advirtiera. #102036 (János Benjamin Antal).
  • Corrige un ERROR LÓGICO (Tamaño inesperado del tipo de índice) que podía producirse en consultas RIGHT JOIN y FULL JOIN cuando se había configurado el ajuste max_bytes_in_join. #102042 (Jimmy Aguilar Mena).
  • Corrige los casos en los que Time con valores negativos devolvía resultados incorrectos al compararse con DateTime. Cierra #101670. #102056 (Yarik Briukhovetskyi).
  • Se corrige un crash en la actualización de UDF causado por ZooKeeperRetriesControl, que reintentaba sobre una sesión de ZooKeeper obsoleta (caducada) sin renovarla. #102059 (Nikita Fomichev).
  • Corrige los espacios que faltaban al formatear unlock snapshot. cierra https://github.com/clickhouse/clickhouse/issues/101723. #102063 (Han Fei).
  • Se corrige un fallo (SIGSEGV) al consultar una vista con una cláusula WHERE cuando la consulta interna genera columnas con tipos distintos de los metadatos de la vista (p. ej., Nullable de LEFT JOIN con join_use_nulls). #102085 (Miсhael Stetsyuk).
  • Se corrigen las entradas de VectorSimilarityIndexCache que nunca se desalojaban al eliminar una parte debido a una discrepancia en las claves de la caché. #102152 (Seva Potapov).
  • Hacer NACK de los mensajes defectuosos al usar almacenamiento de RabbitMQ. #102157 (Seva Potapov).
  • Se corrige un error lógico al analizar una cadena incorrecta correspondiente a una tupla vacía. #102289 (Nihal Z. Miaji).
  • Corrige resultados de agregación incorrectos (filas duplicadas) al usar optimize_aggregation_in_order=1 con columnas de GROUP BY en un orden distinto al de la clave de ordenación de la tabla. #102299 (Groene AI).
  • Se corrige un fallo en IcebergLocal ALTER TABLE ... UPDATE al usar el formato Avro, causado porque los tipos envoltorio LowCardinality/Nullable no se desenvolvían antes de la serialización. #102337 (Desel72).
  • Se corrigió un fallo de segmentación en mutaciones sobre columnas materializadas sin expresión. Resuelve #102185. #102342 (zoomxi).
  • Corrección en Coalescing merge tree para el tipo Array. Se cierra #89509. #102384 (Konstantin Vedernikov).
  • Se corrige un segfault (o LOGICAL_ERROR en compilaciones de depuración) al leer archivos Parquet con el push down del filtro bloom habilitado y condiciones de igualdad/desigualdad en la cláusula WHERE. El fallo se producía por un acceso a memoria fuera de límites durante la recuperación de datos del filtro bloom del prefetcher de Parquet, y también podía provocar resultados de consulta incorrectos y no deterministas. #102385 (Groene AI).
  • Corrige el LOGICAL_ERROR que abortaba el redimensionamiento dinámico de la caché del sistema de archivos SLRU, causado por estadísticas de desalojo compartidas entre subcolas y una ruta de recuperación incorrecta para candidatos fallidos. #102396 (Antonio Andelic).
  • Corrige un fallo al inicializar tablas alias sin tabla de destino en una réplica nueva de la base de datos Replicated. Cierra #101320. #102397 (Nikolay Degterinsky).
  • Se corrige una lectura fuera de los límites en las funciones de búsqueda en cadenas (countSubstrings, position, etc.) al buscar una subcadena objetivo compuesta íntegramente por bytes nulos. #102401 (Raúl Marín).
  • Los ajustes de los índices de texto completo (enable_full_text_index, allow_experimental_full_text_index, use_skip_indexes_on_data_read) ya no se desactivan cuando la configuración compatibility apunta a una versión anterior a la 26.1. Antes, esto podía impedir que SharedDatabaseCatalog creara tablas con índices de texto. #102422 (Nikita Fomichev).
  • Corregida una lectura fuera de límites en printf con un % al final. #102472 (Raúl Marín).
  • Corrige una excepción de chassert ReadBuffer is canceled en compilaciones de depuración de AsynchronousMetrics, causada porque rewind no restablecía la marca de cancelación del búfer. #102524 (Yuri Fedoseev).
  • Se corrigió hasToken / hasTokenOrNull con cadenas de búsqueda formadas solo por separadores (p. ej., '()', '!!!') en columnas con un índice de texto: anteriormente, el índice omitía silenciosamente todos los gránulos en lugar de generar BAD_ARGUMENTS (para hasToken) o devolver NULL (para hasTokenOrNull). #102544 (Jimmy Aguilar Mena).
  • Soluciona OOM en solicitudes multi enormes en keeper. Para el tracing de OpenTelemetry, asignamos incondicionalmente >1 KiB a spans de OpenTelemetry en objetos ZooKeeperRequest; es decir, en solicitudes multi realmente enormes, intentamos asignar >10 GiB de memoria adicional. Para solucionarlo, ahora mantenemos los datos compartidos en memoria estática y usamos std::unique_ptr en lugar de std::optional en ZooKeeperOpentelemetrySpans. #102586 (Miсhael Stetsyuk).
  • Corregido el problema por el que CurrentMetric de NamedCollection se inflaba con CREATE NAMED COLLECTION IF NOT EXISTS en colecciones existentes, y no se inicializaba para las colecciones cargadas desde la configuración o el almacenamiento SQL al inicio. Cierra #102507. #102598 (Pablo Marcos).
  • Se corrigió una excepción en getStructureOfRemoteTable cuando el segmento local devuelve columnas vacías debido a DDL concurrente. #102604 (Alexey Milovidov).
  • Corrige la excepción LOGICAL_ERROR cuando varias consultas simultáneas CREATE TABLE IF NOT EXISTS se dirigen a la misma tabla S3Queue en una base de datos Shared. #102610 (Nikita Taranov).
  • Se corrige el fallo LOGICAL_ERROR “Unexpected number of rows in column subchunk” en el lector nativo de Parquet V3 al leer columnas Nullable con un filtro WHERE. #102628 (Groene AI).
  • Se corrigió la descripción del evento de perfil AzureWriteMicroseconds, que indicaba “read” en lugar de “write”. #102639 (Miсhael Stetsyuk).
  • Error en la política de filas que provoca la excepción ‘Not found column in block’ en algunos casos especiales. #102648 (Yarik Briukhovetskyi).
  • Se corrigió una excepción del servidor en ClusterDiscovery cuando un clúster estático (definido en la configuración) se quedaba temporalmente sin nodos activos. #102661 (Kseniia Sumarokova).
  • Corrige una inferencia incorrecta del tipo de dato Date en caso de desbordamiento después del ajuste de la zona horaria. Cierra #102601. #102674 (Pavel Kruglov).
  • Corrige el bloqueo indefinido de SYSTEM WAIT VIEW cuando se elimina la vista materializada actualizable mientras la espera está en curso. #102681 (Nikolay Degterinsky).
  • Se corrige CASE con una expresión Dynamic que devolvía ELSE en todas las filas. Cierra #102511. #102684 (Pavel Kruglov).
  • Corrige la serialización del tipo Dynamic aplanado con tipos de datos codificados en formato binario. Cierra #101911. #102692 (Pavel Kruglov).
  • Se corrige un problema por el que format_schema_source=‘query’ ignoraba silenciosamente los resultados de varias filas. Cierra #101905. #102698 (Pavel Kruglov).
  • Informar del código de salida real a través del client SSH en lugar de asignar todos los errores a 1. Cierra #101741. #102700 (Konstantin Bogdanov).
  • Se corrige la pérdida de encabezados HTTP en los controladores de consultas dinámicas y predefinidas. Cierra #101846. #102706 (Konstantin Bogdanov).
  • Aplicar la corrección por muestreo de Poisson a los perfiles de heap colapsados de jemalloc para ajustarlos a la salida de jeprof. Anteriormente, el formato colapsado subestimaba los tamaños reales de asignación al no tener en cuenta la probabilidad de muestreo. #102759 (Antonio Andelic).
  • Se corrige el fallo provocado por un argumento NULL en la función hasPhrase. #102802 (Nikita Taranov).
  • Se corrige un fallo del servidor (SIGSEGV) al leer archivos Avro con esquemas recursivos que contienen referencias cíclicas a tipos simbólicos. Ahora, esos esquemas se detectan y se rechazan con un mensaje de error claro, en lugar de provocar un fallo. #102853 (Groene AI).
  • Corrige un cierre inesperado del servidor (aserción LOGICAL&#95;ERROR) cuando una función sobre una columna Variant alcanza el límite de memoria u otra excepción no relacionada con la conversión de tipos durante la conversión del resultado en FunctionVariantAdaptor. Ahora la excepción se propaga correctamente en lugar de clasificarse por error como un error interno. #102855 (Groene AI).
  • Se corrige un fallo del servidor en compilaciones de depuración/sanitizador cuando se produce std::length_error durante la inferencia de esquema (p. ej., por valores extremos de input_format_msgpack_number_of_columns o datos de entrada malformados). #102859 (Groene AI).
  • Hacer que la representación de NULL en la serialización de columnas replicadas y dispersas respete la configuración (p. ej., format_tsv_null_representation). #102888 (Hechem Selmi).
  • Retroportado en #103499: Se corrigen las solicitudes a S3 que fallaban con ios_base::clear: unspecified iostream_category error en lugar de reintentarse, debido a que BufferedStreamBuf::flushBuffer de Poco no gestionaba escrituras cortas desde la capa de socket. #102894 (Sema Checherinda).
  • Se corrige el problema por el que las optimizaciones de minmax_count_projection y de COUNT(*) trivial quedaban deshabilitadas de forma permanente tras una eliminación ligera, incluso después de que se hubieran fusionado todas las partes con una máscara de eliminación ligera. #102900 (Anton Popov).
  • Se corrigieron cierres inesperados aleatorios en jemalloc debidos a LTO. #102913 (Azat Khuzhin).
  • Optimiza las cadenas OR de las políticas de fila convirtiéndolas en IN en el nuevo analizador. #102915 (Azat Khuzhin).
  • Corrige la corrupción de metadatos de jemalloc debida a la liberación de la caché de páginas con una alineación incorrecta, que puede provocar bloqueos. #102918 (Azat Khuzhin).
  • Los INSERT simples sin vistas materializadas ya no solicitan una cantidad excesiva de slots e hilos de ConcurrencyControl (max_threads en lugar de max_insert_threads), lo que evita la inanición de slots de CC y el crecimiento descontrolado del número de hilos en clústeres con alto throughput de INSERT. #102961 (Sema Checherinda).
  • Reintroducir ArrowMemoryPool para permitir que se lance MEMORY_LIMIT_EXCEEDED y así evitar el OOM del kernel. #102999 (Azat Khuzhin).
  • Se corrige el problema por el que se ignoraba cast_string_to_date_time_mode al hacer CAST a Nullable(DateTime). Cierra #101840. #103035 (Pavel Kruglov).
  • Se añadió compatibilidad con las columnas ALIAS en la optimización de lectura directa del índice de texto. #103037 (Anton Popov).
  • Retroportado en #103454: se corrige un problema por el que SELECT DISTINCT devolvía silenciosamente resultados incompletos cuando una proyección de agregación coincidía con la consulta y algunas partes de la tabla no tenían datos de proyección (p. ej., la proyección se añadió a una tabla que ya contenía datos y no se ejecutó MATERIALIZE PROJECTION). Cierra #102951. #103052 (Nihal Z. Miaji).
  • Corrige los resultados erróneos devueltos por WHERE x AND toNullable(N) en tablas MergeTree cuando N es un entero de mayor tamaño que UInt8 (p. ej., 256, 65535, 2147483648 o cualquier entero negativo). El filtro descartaba incorrectamente todas las filas porque splitFilterNodeForAllowedInputs usaba un cero NULL al convertir a booleano el remainder Nullable de un AND reducido, lo que hacía que la comparación se convirtiera en NULL bajo la lógica ternaria. #103077 (Groene AI).
  • Se corrigió el tipo de argumento incorrecto que se mostraba en los mensajes de error de las funciones de búsqueda de cadenas (p. ej., locate, position) cuando los argumentos se pasan en orden invertido (locate(needle, haystack) con function_locate_has_mysql_compatible_argument_order = 1). #103102 (Alex Kuleshov).
  • Se corrige que waitForPause quede bloqueado indefinidamente cuando se llama a disableFailPoint sin ningún hilo pausado en el failpoint. #103119 (Shaohua Wang).
  • Limite las cadenas del paquete TCP Hello previo a la autenticación a 64 KB y agregue la configuración del servidor handshake_timeout_milliseconds para limitar el tiempo total del protocolo de enlace, evitando que los clientes no autenticados consuman memoria en exceso o mantengan hilos ocupados indefinidamente. #103284 (Sema Checherinda).
  • Corregidas las estadísticas de ColumnIndex de Parquet cuando min_value > max_value en columnas String. #103334 (Saurabh Kumar Ojha).
  • Validación de datos Dynamic aplanados malformados en Native format. #103392 (Pavel Kruglov).
  • Poblar la columna _time a partir de la función de tabla url. #103437 (Nikita Taranov).
  • Corregida la detección de SVE cuando se utilizan instrucciones SVE no disponibles. #103568 (Raúl Marín).

mejora en compilación/pruebas/empaquetado

  • La dependencia de Libstemmer (Snowball) ahora utiliza la versión más reciente, la v3.0.1. #99256 (Jimmy Aguilar Mena).
  • Se aleatorizó la configuración en clickhouse-test: use_skip_indexes_for_top_k, use_top_k_dynamic_filtering, query_plan_max_limit_for_top_k_optimization. #91782 (Nikita Fomichev).
  • Implementar una prueba de estrés para las funciones, para comprobar la robustez de sus distintas propiedades. #93543 (Michael Kolupaev).
  • Proporcionar una configuración propia de CMake para llvm-project en lugar de importar la de upstream. #97453 (Konstantin Bogdanov).
  • Aleatorizar más configuraciones optimize_* en la infraestructura de pruebas para mejorar la cobertura de las pasadas de optimización de consultas. #97547 (Alexey Milovidov).
  • Usa la toolchain de Rust nightly-2026-03-22. #98602 (Konstantin Bogdanov).
  • Se usa wasmtime v42.0.1. #98603 (Konstantin Bogdanov).
  • Se usa llvm-project 22.1.1. #98882 (Konstantin Bogdanov).
  • Se reemplazó SANITIZE_COVERAGE (callbacks personalizados del sanitizador, granularidad a nivel de símbolo) por la cobertura basada en código fuente de LLVM (WITH_COVERAGE, -fprofile-instr-generate -fcoverage-mapping) para el pipeline nocturno de cobertura por prueba. El server ahora lee su propio mapa de cobertura de las secciones ELF durante el arranque y recopila tuplas (file, line_start, line_end) por prueba mediante un nuevo comando SYSTEM SET COVERAGE TEST 'name'. La selección de pruebas en las comprobaciones de CI específicas usa consultas por rango de líneas sobre una nueva table CIDB checks_coverage_lines y ordena las pruebas candidatas según cuántas líneas modificadas del diff cubren. #99513 (Nikita Fomichev).
  • Corrige el error de enlazado de llvm-libc en compilaciones con -O0. #100023 (Zheguang Zhao).
  • Se corrigieron dos mensajes de error al arrancar el contenedor cuando la configuración no contenía las opciones logger.log y logger.errorlog (p. ej., cuando todos los mensajes de registro deben enviarse a STDOUT/STDERR). #100239 (Simon).
  • Se prefiere ld64.lld en lugar del ld de Apple (cctools-port ld64) para las compilaciones de macOS. Esto debería reducir significativamente los tiempos de enlace en Darwin, ya que el ld64 de cctools-port es muy lento con -ffunction-sections y -dead_strip. Se vuelve a ld si ld64.lld no está disponible. #100275 (Alexey Milovidov).
  • Pruebas para garantizar que los directorios no registren secretos (REST + Glue). #100307 (Konstantin Vedernikov).
  • Repetir las pruebas modificadas recientemente con distintas configuraciones aleatorias. #100385 (Alexey Milovidov).
  • Registrar las dependencias de archivos #embed en CMake y habilitar el modo de dependencias de ccache para que las recompilaciones sean correctas. #100411 (Alexey Milovidov).
  • Se añadieron pruebas de corrección para consultas TPC-H. #100580 (Raufs Dunamalijevs).
  • Se usa aws-sdk-cpp 1.11.771. #100582 (Konstantin Bogdanov).
  • Permitir que los archivos XML de pruebas de rendimiento hagan referencia a archivos externos con consultas SQL y ajustes mediante el atributo file. #100747 (Raufs Dunamalijevs).
  • Se corrigió la compilación con -march=x86-64-v4 añadiendo la inclusión faltante de TargetSpecific.h en LowerUpperImpl.h. #100932 (Alexey Milovidov).
  • Se corrige la compilación en Gentoo al añadir —no-default-config a cxxflags. #100973 (Isak Ellmer).
  • Se añadió utils/auto-bisect/ — un marco de bisección basado en shell que descarga binarios precompilados de CI y ejecuta un script de prueba proporcionado por el usuario para encontrar el primer commit que introdujo una regresión, sin necesidad de una compilación local. #100989 (Nikita Fomichev).
  • Se desactiva ThinLTO de forma predeterminada en CMake para que las compilaciones locales de los desarrolladores ya no lo activen implícitamente. Las compilaciones de release de CI no se ven afectadas, ya que pasan explícitamente -DENABLE_THINLTO=1. #101041 (Alexey Milovidov).
  • Añade el benchmark TPC-DS SF1 a las pruebas de rendimiento. #101209 (Raufs Dunamalijevs).
  • Se añadieron pruebas sin estado para las eliminaciones ligeras de MergeTree que cubren: el ciclo de vida de la marca has_lightweight_delete, la corrección de COUNT(*) con optimize_trivial_count_query, la integridad de las columnas MATERIALIZED/DEFAULT, la recuperación de la marca en ReplicatedMergeTree, read_in_order con filas eliminadas, múltiples ciclos de eliminación y merge, la ocultación de la columna _row_exists, la variedad de predicados y la aplicación de RBAC en ALTER DELETE. #101792 (Nikita Fomichev).
  • Ahora se publican imágenes distroless de Docker con variantes ubuntu y alpine para las versiones etiquetadas. #101941 (Rahul Nair).
  • Los stack traces ahora muestran rutas relativas limpias (p. ej., src/Common/Exception.cpp) en lugar de rutas contaminadas con el directorio de compilación (p. ej., ./ci/tmp/fast_build/./src/Common/Exception.cpp). #102000 (Raúl Marín).
  • Añade una comprobación de estilo de CI que rechace los archivos de más de 5 MB incluidos en commits del repositorio, con una lista blanca para los datos de prueba legítimos ya existentes. Elimina zookeeper_log.parquet, sin usar, de 14 MB. #102080 (Raúl Marín).
  • Elimina ~400 directivas #include sin usar de las cabeceras para reducir los tiempos de compilación. #102585 (Raúl Marín).
  • Se utiliza wasmtime v43.0.1. #102603 (Konstantin Bogdanov).
  • Se utiliza openssl 3.5.6. #102606 (Konstantin Bogdanov).
  • Use xz 5.8.3. #102607 (Konstantin Bogdanov).
  • Actualización de la imagen base distroless de Docker de Debian 12 (glibc 2.36, OpenSSL 3.0) a Debian 13 (glibc 2.41, OpenSSL 3.5), lo que reduce la superficie de CVE a cero vulnerabilidades alcanzables. #101678 (Rahul Nair).

Lanzamiento de ClickHouse 26.3 LTS, 2026-03-26. Presentación, Vídeo

Cambio incompatible con versiones anteriores

  • Volver a una versión anterior tras actualizar puede provocar pérdida de datos. Las versiones de serialización de los tipos de datos ahora se propagan a los tipos de datos anidados. Por ejemplo, la versión de serialización de String with_size_stream antes se aplicaba solo a las columnas String de nivel superior y a los elementos de Tuple. Ahora se aplica a cualquier tipo String dentro de cualquier tipo anidado, como Array/Map/Variant/JSON/etc. Este comportamiento está controlado por la configuración de MergeTree propagate_types_serialization_versions_to_nested_types, que ahora está activada de forma predeterminada. Después de este cambio, las partes de datos recién creadas no pueden ser leídas por versiones anteriores, pero las partes antiguas pueden leerse en la versión nueva sin problemas. La actualización es segura, pero volver a una versión anterior no lo es: si necesitas revertir después de actualizar a 26.3, ¡los datos escritos por 26.3 en columnas con tipos anidados no podrán leerse! Consulta #101429 para más detalles. #94859 (Pavel Kruglov).
  • Se elimina el tipo de índice de omisión hypothesis. Era una función experimental poco conocida y de utilidad práctica limitada. Crear tablas con INDEX ... TYPE hypothesis ahora producirá un error. #96874 (Alexey Milovidov).
  • Se elimina la función experimental detectProgrammingLanguage. #99567 (Alexey Milovidov).
  • Se corrige la precedencia del operador NOT para ajustarla al estándar SQL: NOT ahora tiene menor precedencia que IS NULL, BETWEEN, LIKE y los operadores aritméticos. Por ejemplo, NOT (x) IS NULL ahora se interpreta como NOT (x IS NULL) en lugar de (NOT x) IS NULL. Esto puede cambiar el resultado de las consultas que dependían del comportamiento anterior (no estándar). #97680 (Alexey Milovidov).
  • Corrige los metadatos de las proyecciones normales para que las proyecciones con claves de ordenación de varias columnas se reconozcan adecuadamente. Se basa en #90429. #91352 (Amos Bird).
  • Se corrigió un problema por el que los archivos de índices de omisión no respetaban la configuración replace_long_file_name_to_hash, lo que provocaba errores de “Nombre de archivo demasiado largo” y fallos al leer índices con nombres largos. Ahora, los nombres de archivo de los índices de omisión se convierten en hash cuando superan max_file_name_length, de forma similar a los archivos de columnas. Esto es retrocompatible (los servidores nuevos leen las partes antiguas), pero una degradación de versión (o el uso de servidores antiguos durante una actualización gradual) puede hacer que se ignoren los índices con nombres largos. #97128 (Raúl Marín).
  • Se activa async insert de forma predeterminada. Ahora ClickHouse agrupará por lotes todas las inserciones pequeñas de forma predeterminada. Este ajuste se define en compatibility. Si establece compatibility=<version less than 26.2>, el valor predeterminado será el anterior, false. Puede activar o desactivar async inserts en varios niveles: en la configuración de los perfiles de usuario, para la sesión, para la consulta o para la tabla MergeTree. #97590 (Sema Checherinda).
  • Se cambió el valor predeterminado de mysql_datatypes_support_level de vacío a decimal,datetime64,date2Date32, lo que permite la asignación correcta de DATE de MySQL a Date32, de DECIMAL/NUMERIC a Decimal y de DATETIME/TIMESTAMP con precisión a DateTime64 de forma predeterminada. Anteriormente, las columnas DATE de MySQL se asignaban a Date, que no puede representar fechas anteriores a 1970-01-01, lo que provocaba corrupción de datos. #97716 (Alexey Milovidov).
  • Aceptar un array de nombres de las partes en lugar de una expresión regular para mergeTreeAnalyzeIndexes{,UUID}, ya que las expresiones regulares son lentas (Funcionalidad experimental). #98474 (Azat Khuzhin).
  • Cambiar el valor predeterminado de stderr_reaction de throw a log_last para las UDF ejecutables. Las UDFs que escriben advertencias en stderr ya no provocan errores cuando el código de salida es 0. Las excepciones por código de salida ahora incluyen el contenido de stderr. #99232 (Xu Jia).

Nueva funcionalidad

  • Se añadió serialización en buckets para columnas Map en MergeTree (map_serialization_version = 'with_buckets'). Las claves se dividen en buckets basados en hash, de modo que al leer una sola clave (m['key']) solo se lea un bucket en lugar de toda la columna, lo que proporciona una aceleración de 2 a 49 veces en búsquedas de una sola clave, según el tamaño del mapa. El número de buckets y la estrategia de asignación a buckets pueden controlarse mediante nuevas configuraciones de MergeTree: map_serialization_version, max_buckets_in_map, map_buckets_strategy, map_buckets_coefficient y map_buckets_min_avg_size. #99200 (Pavel Kruglov).
  • Compatibilidad con CTE materializadas. Permite evaluar las CTE solo una vez durante la ejecución de la consulta y almacenar sus resultados en tablas temporales. Cierra #53449. #94849 (Dmitry Novik).
  • Permite usar determinadas funciones estándar de SQL sin paréntesis por compatibilidad, como NOW. Cierra #52102. #95949 (Aly Kafoury).
  • Ahora puede usar la función de clave de ordenación natural naturalSortKey(s). #90322 (Nazarii Piontko).
  • Ahora puede usar JSON/Object nativo como entrada para las funciones JSONExtract. Cierra #88370. #96711 (Fisnik Kastrati).
  • Si un parámetro de consulta es de tipo Nullable y no se especifica, asumiremos que su valor es NULL. #93869 (Vikash Kumar).
  • Se admite ZooKeeper auxiliar para la base de datos Replicated. #95590 (RinChanNOW).
  • Se añadió compatibilidad con la función has para el tipo JSON a fin de comprobar la existencia de una ruta, de forma similar a Map. #96927 (DQ).
  • Se añadió la función de tabla mergeTreeTextIndex(database, table, index), que permite leer datos directamente desde un índice de texto. Esta función puede usarse para tareas de introspección o para realizar agregaciones sobre los datos del índice de texto. #97003 (Anton Popov).
  • Añade la configuración de MergeTree table_readonly para marcar las tablas como de solo lectura y evitar inserciones y modificaciones. #97652 (Alexey Milovidov).
  • Se añade la nueva configuración use_partition_pruning y el alias use_partition_key. Establécela en false para deshabilitar la poda de particiones en función de la clave de partición. #97888 (Nihal Z. Miaji).
  • Implementa ALTER TABLE ... EXECUTE expire_snapshots('<timestamp>') en tablas Iceberg. #97904 (murphy-4o). #99130
  • Permite que cada entrada type=http de <protocols> especifique una clave <handlers> personalizada que apunte a una sección de configuración <http_handlers_*> independiente, lo que permite definir distintas reglas de enrutamiento HTTP para cada puerto. #98414 (Amos Bird).
  • Se agrega la opción pretty=1 a EXPLAIN para obtener una salida con sangría en forma de árbol, y compact=1 para contraer los pasos de Expression, lo que hace que los planes de consulta sean más legibles. #98500 (Kirill Kopnev).
  • Se añade la configuración del servidor restore_access_entities_with_current_grants. Cuando está habilitada, los usuarios/roles restaurados desde copias de seguridad ven sus grants limitados a lo que el usuario que realiza la restauración puede conceder (con la misma semántica que GRANT CURRENT GRANTS), en lugar de fallar con ACCESS_DENIED. #98795 (pufit).
  • Se añaden las funciones caseFoldUTF8 y removeDiacriticsUTF8 para el plegado de mayúsculas y minúsculas de Unicode y la eliminación de marcas diacríticas. #98973 (George Larionov).
  • Se agregó la función de cadena normalizeUTF8NFKCCasefold para la normalización Unicode NFKC_Casefold, que combina la normalización NFKC con el plegado de mayúsculas y minúsculas. #99276 (George Larionov).
  • Se añade el tokenizer asciiCJK para índices de texto completo y la función tokens. Segmenta el texto según las reglas de límites de palabras de Unicode: las palabras ASCII se forman con caracteres conectores (guion bajo, dos puntos, punto y comilla simple), mientras que los caracteres Unicode no ASCII se convierten en tokens de un solo carácter. #99357 (Amos Bird).
  • Se agregaron las configuraciones max_skip_unavailable_shards_num y max_skip_unavailable_shards_ratio para limitar cuántos segmentos pueden omitirse sin avisar cuando skip_unavailable_shards está habilitado. Si la cantidad o la proporción de segmentos no disponibles supera el umbral configurado, se genera una excepción en lugar de devolver resultados incompletos sin avisar. #99369 (Alexey Milovidov).
  • Ahora los usuarios pueden usar la palabra clave SOME en expresiones de subconsulta. Se comporta de forma idéntica a ANY. #99842 (Artem Kytkin).
  • Se añade la configuración output_format_trim_fixed_string para eliminar los bytes nulos al final de los valores FixedString en los formatos de salida de texto. #97558 (NeedmeFordev).
  • Se admiten expresiones JOIN de tablas entre paréntesis en la cláusula FROM, p. ej., SELECT * FROM (t1 CROSS JOIN t2). #97650 (Alexey Milovidov).
  • Implementar la función toDaysInMonth: devuelve el número de días del mes correspondiente a la fecha especificada. #99227 (Vitaly Baranov).

Funcionalidad experimental

  • Se añade compatibilidad experimental con funciones definidas por el usuario (UDFs) basadas en WebAssembly, lo que permite implementar lógica de funciones personalizadas en WebAssembly y ejecutarla dentro de ClickHouse. Agradecimientos especiales a Alexey Smirnov por aportar compatibilidad con el backend de Wasmtime. #88747 (Vladimir Cherkasov). Mejoras incrementales en la compatibilidad con UDF de WASM. #99373 (Vasily Chekalkin).
  • Se añade compatibilidad con dialectos SQL externos mediante la biblioteca polyglot. #99496 (Alexey Milovidov).
  • Se añade el códec de compresión de punto flotante ALP (sin fallback ALP_rd para valores double no compresibles). #91362 (Nazarii Piontko).
  • Se añaden indicaciones de tipo diferidas experimentales para columnas JSON. Cuando se habilita mediante allow_experimental_json_lazy_type_hints, la instrucción ALTER TABLE ... MODIFY COLUMN json JSON(path TypeName) que solo añade o modifica indicaciones de tipo se completa de forma instantánea como una operación solo de metadatos, sin reescribir datos históricos. Las indicaciones de tipo se aplican en tiempo de consulta a las partes antiguas y se materializan durante las operaciones INSERT y las fusiones en segundo plano. #97412 (tanner-bruce).
  • Se habilitan lecturas paralelas desde el motor de tabla YTsaurus. #97343 (MikhailBurdukov).

Mejora del rendimiento

  • Mejora el rendimiento de los lagos de datos. En versiones anteriores, la lectura desde el almacenamiento de objetos no ajustaba el pipeline al número de hilos de procesamiento. Esto supone mejoras de varios órdenes de magnitud (~40x) en máquinas multinúcleo. #99548 (Alexey Milovidov).
  • Ahora, la relación entre enable_parallel_replicas y automatic_parallel_replicas_mode es la siguiente. Una consulta puede usar réplicas paralelas solo si enable_parallel_replicas > 0. Además, si automatic_parallel_replicas_mode=1, la decisión de usar réplicas paralelas se toma durante la planificación en función de las estadísticas recopiladas previamente. Si automatic_parallel_replicas_mode=0, las réplicas paralelas se usarán en todas las consultas compatibles, independientemente de las estadísticas. Una excepción destacada es insert-select distribuido con réplicas paralelas: en este caso, las consultas siempre se ejecutarán como si automatic_parallel_replicas_mode=0. #97517 (Nikita Taranov).
  • Permite la poda de particiones cuando el predicado contiene cualquier operador de comparación (=, <, >, !=) y la clave de partición está incluida en una cadena de funciones deterministas (p. ej., PARTITION BY x y predicados como cityHash64(x) % 5 > 2, toYYYYMM(x) < 2026, toYYYYMM(x) = 2026 o toYYYYMM(x) != 2026 usarán la clave de partición para la poda). Cierra #28800. #98432 (Nihal Z. Miaji).
  • Permite la optimización de lectura en orden y la poda de la primary key cuando el tipo de destino de CAST es Nullable y la conversión es monótona; por ejemplo, con PRIMARY KEY x, ClickHouse puede usar la optimización de lectura en orden para ORDER BY x::Nullable(UInt64) y aplicar la poda de la primary key a predicados como WHERE x::Nullable(UInt64) > 500000. #98482 (Nihal Z. Miaji).
  • Se habilitan la poda de índices y el pushdown de filtros cuando una columna de tipo entero se compara con un literal de coma flotante; por ejemplo, predicados como WHERE x < 10.5 ahora pueden usar la clave primaria para la poda, y filtros como prime < 1e9 o number < 1e5 ahora hacen pushdown en las funciones de tabla primes() y numbers() en lugar de provocar una ejecución sin límite. Cierra #85167. #98516 (Nihal Z. Miaji).
  • Se añadió una nueva caché SLRU para los metadatos de Parquet a fin de mejorar el rendimiento de lectura, al eliminar la necesidad de volver a descargar archivos solo para leer esos metadatos. #98140 (Grant Holly).
  • Se admite el intercambio de lados en los joins ANTI, SEMI y FULL según las estadísticas del optimizador. #97498 (Hechem Selmi).
  • Optimiza el descarte de gránulos para pointInPolygon en polígonos grandes y corrige que el análisis de índices de pointInPolygon arroje excepciones durante la poda de la clave primaria. #91633 (Nihal Z. Miaji).
  • Mejora del rendimiento de la función levenshteinDistance. #94543 (Joanna Hulboj).
  • Optimiza las conversiones por lotes de tipo Decimal al evitar llamadas a funciones para cada elemento. #95923 (Konstantin Bogdanov).
  • Las tablas Iceberg ahora admiten la precarga asíncrona de metadatos mediante la configuración de tabla iceberg_metadata_async_prefetch_period_ms, que precarga periódicamente la caché de metadatos. Además, la configuración de consulta iceberg_metadata_staleness_ms permite que las consultas SELECT usen metadatos en caché si son más recientes que el umbral de obsolescencia especificado, lo que elimina las llamadas al catálogo Iceberg durante el procesamiento de solicitudes. #96191 (Arsen Muk).
  • El modo ordered de S3Queue usa S3 ListObjectsV2 StartAfter para evitar volver a listar el historial completo del prefijo, lo que reduce las llamadas a ListObjects. #96370 (Venkata Vineel ).
  • Menor uso de memoria para la deduplicación de inserciones. En general, el bloque original es necesario para la deduplicación, pero en los insert síncronos se pudo omitir y ahorrar memoria por completo. #96661 (Sema Checherinda).
  • Se usa un valor específico de la arquitectura para el tamaño de línea de caché en lugar de un valor fijo de 64. #97357 (Nikita Taranov).
  • Se optimizó ligeramente la lectura del diccionario del índice de texto, lo que mejora el rendimiento general del análisis de índices de texto. #97519 (Anton Popov).
  • Acelera la descompresión de bloques de 16 bytes con LZ4 en ARM. #97774 (Raúl Marín).
  • Se ha refactorizado la tokenización con una nueva interfaz de alto rendimiento, sustituyendo la antigua API de tipo iterador para admitir SIMD y tokenizadores con estado. Parte de #90268. #97871 (Amos Bird).
  • Se mejoró el rendimiento del análisis de índices de texto para consultas con condiciones combinadas que involucran columnas indexadas y no indexadas. Anteriormente, la optimización de salida temprana durante el análisis de índices se deshabilitaba incorrectamente en estos casos. #98096 (Anton Popov).
  • Mejora el rendimiento de las consultas que contienen expresiones constantes que generan arrays o maps muy largos. #98287 (Alexey Milovidov).
  • Se corrigió el análisis de las condiciones sobre claves primarias DateTime64 al compararlas con constantes enteras, lo que antes impedía la poda de gránulos. #98410 (Amos Bird).
  • La configuración optimize_syntax_fuse_functions está activada de forma predeterminada. #98424 (Alexey Milovidov).
  • Optimiza la función de agregación avgWeighted mediante acumuladores locales en lugar del almacenamiento y reenvío fila por fila a través del estado de agregación, mejorando el rendimiento hasta en un 27 % para entradas Nullable. #98793 (Antonio Andelic).
  • Mejora el rendimiento y reduce el uso de memoria de las funciones de ventana paralelas en determinados escenarios, así como de las cargas de trabajo de arrayFold con arrays grandes. Esto también puede reducir la presión de fallos de página y mejorar la estabilidad con límites de memoria ajustados en las consultas afectadas. #98892 (filimonov).
  • Mejora el rendimiento de las fusiones ordenadas. #99013 (Artem Zuikov).
  • Se optimizan INTERSECT ALL y EXCEPT ALL. #99097 (Raufs Dunamalijevs).
  • Se añadió soporte para la optimización read_in_order_use_virtual_row en lecturas en orden inverso. #99198 (Vladimir Cherkasov).
  • Reducir la contención de la caché en los RIGHT y FULL JOINs comprobando si JoinUsedFlags está definido antes de escribir. #99274 (Hechem Selmi).
  • Optimiza PrefetchingHelper::calcPrefetchLookAhead sustituyendo la aritmética de coma flotante por aritmética entera pura, mejorando la disposición de la caché de instrucciones y reduciendo la sobrecarga de ciclos en los bucles de agregación. #99327 (Riyane El Qoqui).
  • Reducir el consumo de memoria de Keeper sustituyendo absl::flat_hash_set por CompactChildrenSet para almacenar los hijos de los nodos. El nuevo contenedor almacena de 0 a 1 hijos directamente, sin asignación en el heap, lo que cubre la mayoría de los nodos de Keeper. Esto reduce el tamaño de KeeperMemNode de 144 a 128 bytes. #99860 (Antonio Andelic).
  • Las proyecciones de agregación ahora funcionan correctamente en las vistas. Corrige #32753. #88798 (Amos Bird).
  • Se añadió compatibilidad con la optimización de conversión de OUTER a INNER join con join_use_nulls. Cierra #90978. #95968 (Vladimir Cherkasov).
  • Mejora la lectura de subcolumnas mediante el cálculo correcto de los tamaños antes de leerlas. Reduce el uso de memoria y acelera la lectura de subcolumnas. #96251 (Pavel Kruglov).
  • Hacer que las cachés de mark, de datos sin comprimir y de páginas utilicen una arena de jemalloc independiente para evitar la fragmentación de memoria cuando las asignaciones de corta duración, es decir, para consultas y solicitudes, se mezclan con asignaciones de mayor duración para las cachés. #96812 (Seva Potapov). #98812. #99021
  • Las tablas con reglas DELETE TTL ahora pueden utilizar el algoritmo de fusión vertical. #97332 (murphy-4o).
  • Aplicar índices de omisión de datos durante el análisis distribuido de índices. #97767 (Azat Khuzhin).
  • Las marcas de los índices secundarios ahora se precargan cuando la configuración prewarm_mark_cache está habilitada (se cargan en la caché de marcas de índice durante la obtención de partes de datos y el arranque de la tabla). #97772 (Anton Popov).
  • Menor bloqueo durante el control de acceso. #97894 (Nikita Taranov).
  • Cuando se habilita apply_row_policy_after_final o apply_prewhere_after_final, las condiciones compuestas con AND en las políticas de fila y en PREWHERE ahora se descomponen para extraer átomos de la clave de ordenación y utilizarlos en el análisis del índice de clave primaria. Anteriormente, si un filtro diferido contenía una combinación de predicados de la clave de ordenación y de predicados que no pertenecían a ella (p. ej., x > 1 AND y != ‘foo’), toda la expresión quedaba excluida del análisis del índice. Ahora, los átomos de la clave de ordenación (como x > 1) se extraen y se usan para la poda de gránulos, incluso dentro de expresiones AND anidadas. #98513 (Yarik Briukhovetskyi).
  • Reduce la contención por bloqueos en MergeTreeBackgroundExecutor al hacer que los recursos de la tarea se liberen sin adquirir el bloqueo. Cierra #93620. #98604 (Dmitry Novik).
  • Corrige el uso excesivo de memoria (~514 MiB) durante la autodetección de formato al leer datos que no son Arrow (p. ej., JSON desde url o file sin un formato explícito), debido a que el lector ArrowStream interpretaba erróneamente los primeros bytes como una longitud de metadatos enorme. #98893 (Konstantin Bogdanov).

Mejora

  • Permite analizar archivos GeoParquet que contienen distintos tipos Geo en la misma columna. #97851 (Mark Needham).
  • Se introduce la función SQL tokensForLikePattern, que tokeniza patrones LIKE respetando la semántica de los comodines: % y _ se consideran comodines, los comodines escapados (\%, \_) se consideran literales y se descartan los tokens adyacentes a comodines no escapados. #97872 (Amos Bird).
  • Se añade un marcador de posición {_schema_hash} para el motor de tabla S3, que inserta un hash de las definiciones de las columnas de la tabla en la ruta de S3. #98265 (Miсhael Stetsyuk).
  • SymbolIndex, addressToSymbol, system.symbols y buildId ahora funcionan en macOS mediante el análisis de las tablas de símbolos Mach-O. #99014 (Alexey Milovidov).
  • La tabla system.stack_trace ahora funciona en macOS, lo que permite inspeccionar las trazas de pila de todos los hilos del servidor. #98982 (Alexey Milovidov).
  • Añade la opción de configuración LDAP por servidor <follow_referrals> (valor predeterminado: false) para controlar si el client LDAP sigue las referencias. Deshabilitar el seguimiento de referencias evita timeouts y bloqueos al buscar desde un base DN raíz de dominio de Active Directory. Los mensajes de registro relacionados con las referencias se han movido de warn a trace. #96765 (paf91).
  • Ahora registramos en una nueva columna llamada skip_indices de la tabla query&#95;log todos los índices de omisión de datos utilizados durante la ejecución de la consulta. Corrige #78676. Autor original @pheepa. #87862 (Grant Holly).
  • Las sugerencias de ACCESS_DENIED ya no revelan los nombres de las columnas, a menos que el usuario pueda mostrar todas las columnas requeridas; los nombres de la base de datos y de la tabla siguen siendo visibles en la sugerencia. #91067 (filimonov).
  • Añade un hilo dedicado a la limpieza para MergeTree, a fin de evitar retrasos en la limpieza cuando la carga de merge es elevada. Esto resuelve #86181. #91574 (Amos Bird).
  • Recargar la configuración del clúster si cambian las IP asociadas al hostname del servidor local, en lugar de las IP de cualquier host. Corrige #81215, #70156 y #65268. #93726 (Zhigao Hong).
  • Permite que optimize_aggregators_of_group_by_keys optimice correctamente las funciones de agregación en las consultas GROUPING SETS. #93935 (Xiaozhe Yu).
  • Keeper-bench: informar de errores en las métricas y generar un archivo JSON de métricas para el modo —input-request-log. #95748 (Mohammad Lareb Zafar).
  • Se añade la nueva cláusula ROLE a CREATE USER. #97074 (Vitaly Baranov).
  • Ahora puede establecer la configuración de internal_replication para un clúster creado por la base de datos Replicated. #97228 (Pervakov Grigorii).
  • Nueva configuración: allow_nullable_tuple_in_extracted_subcolumns controla si las subcolumnas Tuple(...) extraídas de Tuple, Variant, Dynamic y JSON se devuelven como Nullable(Tuple(...)) (NULL para las filas que faltan) o como Tuple(...) (valores de tupla predeterminados para las filas que faltan). Está deshabilitada de forma predeterminada y solo puede cambiarse reiniciando el servidor. #97299 (Nihal Z. Miaji).
  • Agregar información sobre los filtros diferidos como un elemento independiente en la salida de EXPLAIN (al usar Row Policies/PREWHERE con FINAL). Relacionado: #91065. #97374 (Yarik Briukhovetskyi).
  • Habilita type_json_allow_duplicated_key_with_literal_and_nested_object de forma predeterminada. Permite evitar errores por claves duplicadas durante el análisis de JSON como {"a" : 42, "a" : {"b" : 42}}, que ClickHouse puede generar a partir de los datos JSON originales {"a" : 42, "a.b" : 42}. #97423 (Pavel Kruglov).
  • Mejora de Keeper: find_super_nodes es un comando muy útil para depurar el crecimiento inesperado del número de nodos en Keeper. Desafortunadamente, si hay varios supernodos, es casi imposible encontrar más de uno, porque el comando se queda bloqueado indefinidamente al recorrer los hijos del primer supernodo que encuentra. Este PR impide recorrer los hijos de los supernodos. #97819 (pufit).
  • Compatibilidad inicial con el autocompletado para clickhouse-keeper-client. #97828 (Konstantin Bogdanov).
  • Vaciar los búferes de logging asíncrono en caso de cierre inesperado. #97836 (Azat Khuzhin).
  • Se habilita de forma predeterminada la función de suplantación de identidad (consulta EXECUTE AS target_user). #97870 (Vitaly Baranov).
  • Mejora en la cancelación de consultas con el motor de tabla SQLite mediante KILL QUERY y la cancelación de consultas (Ctrl+C) en clickhouse-client. #97944 (Roman Vasin).
  • Se añadió la configuración del servidor jemalloc_profiler_sampling_rate para controlar lg_prof_sample de jemalloc y exponerla como la métrica asíncrona jemalloc.prof.lg_sample. #97945 (Antonio Andelic).
  • Se añade compatibilidad con pesos en la implementación de la cola acotada concurrente. #97962 (Daniil Ivanik).
  • Se añade sslmode a las claves permitidas para los orígenes de diccionario de PostgreSQL. Anteriormente, sslmode no figuraba en la lista de claves permitidas dictionary&#95;allowed&#95;keys de PostgreSQLDictionarySource.cpp, lo que imposibilitaba configurar el modo SSL para las conexiones de diccionario de PostgreSQL. Esto impedía que los diccionarios se conectaran a servidores PostgreSQL que requieren SSL (por ejemplo, AWS RDS, que exige SSL de forma predeterminada), ya que la conexión fallaba durante la negociación TLS y el servidor rechazaba la alternativa no cifrada. #98014 (mcalfin).
  • Mostrar un error claro de “archivo no encontrado” al pasar una ruta de archivo inexistente a clickhouse o clickhouse-local, en lugar de un mensaje genérico confuso. #98048 (Raúl Marín).
  • Ahora también se pueden crear índices de texto en columnas Nullable([Fixed]String) y Array(Nullable([Fixed]String)). #98118 (Jimmy Aguilar Mena).
  • Evite eliminar colecciones con nombre de las que dependan las fuentes de diccionario. #98127 (Pablo Marcos).
  • Se habilita el algoritmo de join grace_hash para consultas con totales. #98144 (János Benjamin Antal).
  • Cancelar antes las fusiones en segundo plano en DROP DATABASE para ordinary shared merge tree. #98161 (Shaohua Wang).
  • Mejora de la cancelación de consultas con MongoDB y MySQL mediante KILL QUERY y la cancelación de consultas (Ctrl+C) en clickhouse-client. #98187 (Roman Vasin).
  • Elimina NetlinkMetricsProvider y usa procfs exclusivamente para recopilar métricas taskstats por hilo. La recopilación basada en Netlink presenta problemas en entornos contenerizados y tiene una latencia en cola peor en situaciones de contención. #98229 (Amos Bird).
  • Se refactorizó el manejo de los archivos de manifiesto de Iceberg para corregir problemas con la caché de archivos de manifiesto. #98231 (Daniil Ivanik).
  • Ahora también tenemos en cuenta los casos en que la clave de ordenación de la tabla puede ser una expresión como toDate(time), y podemos decidir no aplazar expresiones de este tipo si forman parte de filtros. #98237 (Yarik Briukhovetskyi).
  • Añade una nueva métrica MaxAllocatedEphemeralLockSequentialNumber para el número secuencial máximo asignado a los znodes de bloqueo efímeros de ZooKeeper. #98243 (Miсhael Stetsyuk).
  • Actualización de ClickStack a la versión 2.20.0. #98252 (Aaron Knudtson).
  • Se agregó un nuevo evento de perfil KeeperRequestTotalWithSubrequests que cuenta cada subsolicitud dentro de una solicitud múltiple de forma individual, lo que ofrece una mejor visibilidad de la carga de trabajo real de Keeper. El evento existente KeeperRequestTotal sigue contando cada solicitud múltiple como una sola solicitud. #98348 (Antonio Andelic).
  • SYSTEM RELOAD DICTIONARIES ahora recarga los diccionarios en orden topológico para que los diccionarios que toman datos de otros diccionarios vean datos actualizados tras la recarga. #98356 (Alexey Milovidov).
  • Reiniciar la caché de estadísticas después de cambiar la configuración de MergeTree. #98520 (Han Fei).
  • Solo las réplicas “vivas” (a las que se puede acceder) participan en el análisis distribuido de índices. #98521 (Azat Khuzhin).
  • Se añade la configuración access_control_improvements.disallow_config_defined_profiles_for_sql_defined_users (deshabilitada/permitida de forma predeterminada), que impide usar perfiles de configuración definidos en la configuración (excepto el perfil default) para usuarios definidos mediante SQL. #98662 (Alexander Tokmakov).
  • Se limita el número de nodos usados por la heurística automática de réplicas paralelas al número real de nodos del clúster (en lugar de basarse solo en la configuración max_parallel_replicas). #98668 (Nikita Taranov).
  • Implementación de solicitudes redundantes y lectura asíncrona para el análisis distribuido de índices. #98724 (Azat Khuzhin).
  • La deserialización de estados AggregateFunction binarios ahora requiere consumir toda la entrada. Si hay bytes redundantes adicionales al final, ClickHouse lanza una excepción en lugar de aceptar datos de estado malformados. #98786 (Nihal Z. Miaji).
  • Hacer que TRUNCATE DATABASE responda a la cancelación de consultas. #98828 (Shaohua Wang).
  • Se mejora keeper-bench con canalización de solicitudes, período de calentamiento, estadísticas por operación, semillas reproducibles y una mejor gestión de errores. #98906 (Antonio Andelic).
  • Se admite la cláusula SAMPLE en el análisis distribuido de índices. #98931 (Azat Khuzhin).
  • Mostrar el título del gráfico en el dashboard incluso cuando la consulta devuelve un resultado vacío o produce un error. #98975 (Yash ).
  • Los mensajes de error del analizador ya no muestran todas las columnas de una tabla (lo que podía generar excepciones de más de 150 KB). Las listas de columnas ahora están limitadas a 10 elementos. #99002 (Yash ).
  • Devolver correctamente las estadísticas de las columnas de las subconsultas con joins para que la consulta padre pueda utilizarlas para reordenar los joins. #99096 (Alexander Gololobov).
  • Marque la sesión de ZooKeeper como expirada inmediatamente al comenzar la finalización, en lugar de esperar a que termine el hilo de envío. Esto permite que otros hilos establezcan una nueva sesión sin demora. #99102 (Raúl Marín).
  • Se usan más funciones matemáticas de LLVM-libc: exp, exp2, expm1, fabs, fabsl, floor, fmodl, log, log2, logf, pow, scalbn, scalbnl, copysignl, nan, nanf, nanl y las constantes compartidas explogxf. #99118 (Konstantin Bogdanov).
  • Reducir el uso de memoria y corregir una posible duplicación de la salida en el formato collapsed de system.jemalloc_profile_text. #99121 (Antonio Andelic).
  • Se añadió la columna is_subrequest a system.aggregated_zookeeper_log para separar las solicitudes independientes de las subsolicitudes dentro de las solicitudes Multi/MultiRead. Anteriormente, las subsolicitudes se agregaban en las mismas agrupaciones que las solicitudes independientes y, como cada suboperación se registraba con la duración total de la solicitud múltiple, la latencia media resultaba engañosa. Las subsolicitudes ahora tienen latencia cero. #99169 (Miсhael Stetsyuk).
  • Permite el comando ALTER TABLE MODIFY COLUMN x TTL ... sin especificar el tipo de columna. #99208 (Nikolay Degterinsky).
  • Se omiten las solicitudes obsoletas de Keeper para las sesiones que ya se han desconectado, lo que evita recorridos de ida y vuelta innecesarios de Raft. El número de sesiones finalizadas rastreadas está limitado por la configuración de coordinación max_finished_sessions_cache_size. #99246 (Antonio Andelic).
  • Compatibilidad con índices de texto construidos sobre mapValues(map) con el operador IN. #99286 (Anton Popov).
  • Soporte de autocompletado similar al de una shell en clickhouse keeper-client (gestiona el autocompletado de argumentos entre comillas, es decir, 'foo ba', gestiona argumentos escapados, es decir, foo\ ba, hace que ls imprima los nodos entre comillas si contienen espacios en blanco). #99312 (Azat Khuzhin).
  • Se evita que el comando mntr de Keeper se quede bloqueado por contención de bloqueos. #99472 (Antonio Andelic).
  • Se reduce la contención de bloqueos en el despachador de Keeper al invocar callbacks y despachar solicitudes de lectura fuera del ámbito del mutex, y se añaden guardas de bloqueo con perfilado para la observabilidad. #99751 (Antonio Andelic).
  • Se tolera la ausencia de relleno al final del último bloque de archivos Parquet. #99857 (Seva Potapov).

Corrección de errores (mal funcionamiento visible para el usuario en una versión estable oficial)

  • Corrige cómo se guarda el destino de una tabla Alias como dependencia DDL cuando no está totalmente calificado: ahora se guarda con la base de datos de la tabla Alias en lugar de con la base de datos de la sesión. #95175 (Enric Calabuig).
  • Se corrigió un resultado incorrecto o una excepción durante la lectura de subcolumnas de columnas ALIAS. #95408 (Pavel Kruglov).
  • Corrige la ausencia de una columna al usar un alias de identificador no estándar en JOIN con el analizador antiguo. Soluciona #25594, #47288 y #53263. #95679 (Zhigao Hong).
  • Soluciona un fallo en las funciones del dialecto Kusto bin(), bin_at(), extract() e indexof() cuando se pasan argumentos vacíos. #95736 (NeedmeFordev).
  • Prohíbe montar local_object_storage (que se utiliza en datalakes sobre el sistema de archivos local y, posiblemente, por LocalDisk) en cualquier lugar distinto de user_files_path en clickhouse-client. #96201 (Daniil Ivanik).
  • En el motor de tablas DeltaLake, se corrige una condición de carrera lógica al cambiar la versión de la instantánea y se eliminan recargas redundantes y costosas de la instantánea. #96226 (Kseniia Sumarokova).
  • Se corrigió un error lógico al hacer attach de una parte en MergeTree si se habían producido varios cambios de nombre encadenados entre el detach y el attach. #96351 (Alexey Milovidov).
  • Se corrige un error por el que los ajustes explícitos enviados junto con compatibility en la misma solicitud podían ignorarse de forma silenciosa cuando su valor coincidía con el valor predeterminado del servidor. #97078 (Raufs Dunamalijevs).
  • Se corrige un problema por el que el client informaba NETWORK_ERROR en lugar del error de parsing real (con el número de fila correcto) cuando un INSERT con parsing en paralelo encontraba datos no válidos. #97339 (Alexey Milovidov).
  • Corrige un problema por el que la función de agregación sumCount no podía leer estados serializados antiguos tras la introducción de Nullable(Tuple). Cierra #97370. #97502 (Nihal Z. Miaji).
  • Se corrigió la excepción en la comparación de tuplas que involucra elementos del tipo Nothing (p. ej., al comparar con elementos de tupla NULL) cuando se usa con GROUPING SETS y ORDER BY. #97509 (Alexey Milovidov).
  • Corrige el cálculo no determinista de uncompressed_hash para las partes de Compact MergeTree cuando se utilizan varios códecs de compresión, lo que podía provocar un comportamiento incorrecto de deduplicación. #97522 (Alexey Milovidov).
  • Corrige un error lógico por la falta de stream durante INSERT SELECT con JSON y buckets en shared data. Cierra #97331. #97523 (Pavel Kruglov).
  • Se corrigió el problema por el que las excepciones MEMORY_LIMIT_EXCEEDED se informaban incorrectamente como CORRUPTED_DATA durante las fusiones de SummingMergeTree y CoalescingMergeTree. #97537 (János Benjamin Antal).
  • Soluciona la excepción “Context has expired” en subconsultas correlacionadas que contienen funciones de tabla como url(). #97544 (Alexey Milovidov).
  • Se corrigen excepciones y comportamientos incorrectos en optimize_syntax_fuse_functions con proyecciones de agregación, tipos Date y preservación de nombres de columna. #97545 (Alexey Milovidov).
  • Se elimina la reescritura incorrecta de consultas de replaceRegexpOne a extract, que producía resultados erróneos cuando la regexp no coincidía; también se corrige una excepción cuando replaceRegexpOne se usa con GROUP BY ... WITH CUBE y group_by_use_nulls=1. #97546 (Alexey Milovidov).
  • Se corrige el bloqueo indefinido de DROP DATABASE con database_atomic_wait_for_drop_and_detach_synchronously cuando se fuerza la finalización de la consulta. #97586 (Alexey Milovidov).
  • Se corrigió un problema por el que KILL QUERY no podía finalizar consultas bloqueadas durante la generación de WITH FILL, la carga de diccionarios mediante dictGet o ALTER DELETE con mutations_sync=1 en ReplicatedMergeTree. #97589 (Alexey Milovidov).
  • La función de tabla loop llamaba a inner_storage->read() directamente, omitiendo la capa del intérprete, donde se aplican las políticas de fila, los privilegios a nivel de columna y otras comprobaciones de seguridad. Esto permitía que un usuario restringido por políticas de fila leyera todas las filas mediante loop(table), incluso cuando un SELECT directo devolvía cero filas. #97682 (pufit).
  • Corrige la poda incorrecta de particiones al usar DateTime64 anterior a la época Unix con la función toDate(). #97746 (Yarik Briukhovetskyi).
  • Después de este parche, hasPartitionId devolverá false si existe otra partición con un ID de partición superior en el conjunto de partes de datos. #97748 (Mikhail Artemenko).
  • Se corrigen posibles fallos al leer gránulos vacíos en datos compartidos avanzados en JSON. Cierra #97563. #97778 (Pavel Kruglov).
  • Se corrige Cannot schedule a file LOGICAL_ERROR al hacer INSERT en Distributed debido a una condición de carrera entre DROP e INSERT. #97822 (Azat Khuzhin).
  • Se corrigió un cierre inesperado/fallo de aserción del servidor de ClickHouse en la llamada a mapContainsKey/mapContainsKeyLike con el índice de omisión tokenbf_v1. #97826 (Shankar Iyer).
  • Se corrigieron las excepciones LOGICAL&#95;ERROR causadas por LowCardinality dentro de tipos compuestos (Variant, Dynamic, Tuple) en concatWithSeparator, format, las subconsultas IN, GLOBAL IN y los joins con filtros en tiempo de ejecución. #97831 (Raúl Marín).
  • Se corrige la excepción LOGICAL_ERROR Chunk info was not set for chunk in MergingAggregatedTransform al usar ARRAY JOIN con la función de tabla merge() en varias tablas Distributed combinadas con GROUP BY. #97838 (Raúl Marín).
  • Se corrige un cierre inesperado del servidor (std::terminate) causado por una excepción no capturada en el destructor del grupo de conexiones HTTP cuando se alcanza el límite estricto del grupo de conexiones en condiciones de alta concurrencia. La excepción HTTP_CONNECTION_LIMIT_REACHED podía propagarse desde ~PooledConnection al devolver una conexión al grupo para su reutilización, lo que provocaba SIGABRT. #97850 (Antonio Andelic).
  • Corrige un resultado incorrecto cuando se usa el algoritmo grace_hash con joins no equi y el bloque de la izquierda no puede procesarse por completo debido a las restricciones de tamaño del resultado del join. #97866 (János Benjamin Antal).
  • Corrige la ineficiencia de rendimiento en el escaneo de metadatos de DeltaLake introducida en #96686. #97880 (Kseniia Sumarokova).
  • Se corrigió una condición de carrera de datos en el client de ZooKeeper entre sendThread y receiveThread. #97887 (Pablo Marcos).
  • Corrige un error por el que no era posible usar CTE con sentencias insert SELECT distribuidas. Continuación de https://github.com/ClickHouse/ClickHouse/pull/87789. Cierra #95837. #97889 (Yarik Briukhovetskyi).
  • Corrige una excepción en CachedOnDiskReadBufferFromFile::readBigAt. Cierra #97325. #97890 (Kseniia Sumarokova).
  • Se corrige la excepción LOGICAL_ERROR en el motor Alias con columnas materializadas debido a un desajuste de columnas. Cierra #97907. #97921 (Kai Zhu).
  • Se corrige la pérdida de datos de Keeper tras un reinicio al usar Azure Blob Storage con metadatos s3_plain para el almacenamiento de registros. #97987 (Antonio Andelic).
  • Se corrige una compilación errónea del JIT de la función sign para tipos enteros de mayor tamaño que Int8 — los valores fuera del intervalo -128..127 podían producir un signo incorrecto. #98012 (Alexey Milovidov).
  • Se corrigió la excepción DUPLICATE_COLUMN y la aparición silenciosa de valores NULL al leer tablas de Delta Lake que usan el modo “name” de asignación de columnas con campos de struct cuyos nombres contienen puntos (p. ej., STRUCT<`a.foo`: STRING, `b.foo`: STRING>). #98013 (Caio Ishizaka Costa).
  • Se corrige la mutación tras una actualización ligera y los índices secundarios. #98044 (Raúl Marín).
  • Se corrige un resultado incorrecto en las consultas FINAL al mezclar índices de salto de clave primaria y de columnas que no forman parte de la clave primaria. #98097 (Raúl Marín).
  • Se aplican comprobaciones de READ ON FILE a file() escalar y a DESCRIBE TABLE file(). #98115 (Nikolay Degterinsky).
  • Corrige un fallo por el que, al consultar archivos con un patrón glob (p. ej., file('dir/**', 'LineAsString')), se producía una excepción no controlada del sistema de archivos (STD_EXCEPTION) si el directorio contenía un enlace simbólico roto. Ahora los enlaces simbólicos rotos se omiten silenciosamente, y la consulta devuelve resultados de todos los archivos válidos. #98143 (Mark Andreev).
  • Se corrigió un segfault durante la optimización del plan de consulta al convertir un outer join en un inner join con arrayJoin en una expresión de filtro. #98147 (Alexey Milovidov).
  • Se corrigió el problema por el que el formato ProtobufList no funcionaba con el motor Kafka porque el estado de lectura no se restablecía entre mensajes. #98151 (Alexey Milovidov).
  • Corrige un fallo lógico con analyzer_compatibility_join_using_top_level_identifier y ARRAY JOIN; cierra #98164. #98179 (Vladimir Cherkasov).
  • Configura el componente Watch para las respuestas de watch en aggregated_zookeeper_log en lugar de dejarlo vacío. #98202 (Antonio Andelic).
  • Si las columnas de la clave de partición no están incluidas en la clave de ordenación, la poda de particiones podría omitir por error particiones que contienen filas que deberían “prevalecer” durante la deduplicación FINAL. #98242 (Yarik Briukhovetskyi).
  • Se corrige el error lógico “Bad cast from type DB::ColumnConst to DB::ColumnArray” en kql_array_sort_asc/kql_array_sort_desc cuando se llama con argumentos constantes de tipo array. #98251 (Alexey Milovidov).
  • Se corrigió un acceso fuera de rango en ColumnConst::getExtremes que podía provocar un bloqueo cuando extremes = 1 está habilitado. #98263 (Alexey Milovidov).
  • Se corrige un posible interbloqueo cuando dos operaciones concurrentes de MOVE PARTITION actúan sobre el mismo par de tablas en direcciones opuestas. #98264 (Alexey Milovidov).
  • El servidor HTTP ahora devuelve un mensaje de error en el cuerpo de la respuesta en las respuestas 400 Bad Request causadas por cabeceras malformadas, en lugar de devolver un cuerpo vacío. #98268 (Alexey Milovidov).
  • Corrige resultados incorrectos en el análisis distribuido de índices (función experimental) y en la caché de condiciones de consulta. #98269 (Azat Khuzhin).
  • Se corrigió la excepción LOGICAL_ERROR “Resultado no válido de la búsqueda binaria en MergeTreeSetIndex”, provocada por la conversión toDate en columnas clave con datos que cruzan el umbral de 65535. #98276 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR cuando un RIGHT JOIN contenido dentro de un CROSS JOIN se intercambia mediante la optimización query_plan_join_swap_table en la ruta de código heredada del paso de JOIN. #98279 (Alexey Milovidov).
  • Validar los datos corruptos durante la deserialización de DDSketch para evitar segfaults, excepciones, bucles infinitos y OOM al leer estados corruptos de la función de agregación quantilesDD. #98284 (Alexey Milovidov).
  • Corrige LOGICAL_ERROR “Intentando ejecutar la acción PLACEHOLDER” al hacer referencia a columnas correlacionadas de consultas externas dentro de funciones lambda como arrayMap. #98285 (Alexey Milovidov).
  • Se corrige una excepción por error lógico en caseWithExpression cuando la expresión CASE incluye materialize(NULL) u otros argumentos Nullable(Nothing). #98290 (Alexey Milovidov).
  • Corregida una excepción por conversión de tipo incorrecta al filtrar la columna virtual _table en la table function merge. #98291 (Alexey Milovidov).
  • Se corrige un fallo esporádico de deduplicación por el que las reinserciones se deduplicaban incorrectamente debido a un orden de limpieza incoherente entre los directorios blocks/ y deduplication_hashes/ de ZooKeeper. #98293 (Alexey Milovidov).
  • Se corrigió una excepción al usar ORDER BY ... WITH FILL junto con LIMIT BY. #98361 (Alexey Milovidov).
  • Corrige la corrupción silenciosa de datos al insertar una columna Date de Parquet/Arrow en una columna Enum: ahora rechaza correctamente la conversión incompatible de tipos en lugar de almacenar valores Enum no válidos. #98364 (Alexey Milovidov).
  • Corrige una excepción al leer un archivo Arrow que contiene una columna Array en una tabla con una columna Nested. #98365 (Alexey Milovidov).
  • Se corrigen las mutaciones MATERIALIZE INDEX y MATERIALIZE PROJECTION que se quedaban bloqueadas cuando se eliminaba el índice o la proyección antes de que terminara la mutación. #98369 (Alexey Milovidov).
  • Se corrigió una excepción al leer desde Nullable(Tuple(...)) cuando el nombre de un elemento de Tuple entra en conflicto con la subcolumna null de Nullable. #98372 (Alexey Milovidov).
  • Se corrigió la excepción “Column … query tree node does not have valid source node” al hacer join entre una tabla Merge (que envuelve una tabla Distributed) y otra tabla. #98376 (Alexey Milovidov).
  • Corrige la conversión incorrecta de Parquet Bool a FixedString en el lector nativo V3, que producía bytes sin procesar en lugar de una representación de cadena. #98378 (Alexey Milovidov).
  • Corregido tryGetColumnDescription para filtrar las subcolumnas según el tipo de la columna padre, en consonancia con otros métodos de búsqueda de columnas. #98391 (Alexey Milovidov).
  • Aceptar credenciales base64 sin relleno en la autenticación HTTP Basic. Algunos clientes HTTP omiten el relleno final = en el encabezado Authorization: Basic, lo que antes provocaba fallos de autenticación. #98392 (Amos Bird).
  • Corrige resultados incorrectos de la poda de particiones tras fusionar partes con columnas Nullable de clave de partición, causados por límites incorrectos del índice min-max. #98405 (Amos Bird).
  • Se corrige una excepción poco frecuente en el ejecutor del pipeline, que podía manifestarse como Received signal 6 (solo en compilaciones de depuración) cuando la expansión del pipeline se solapa con la cancelación de la consulta debido a una condición de carrera. #98428 (Alexey Milovidov).
  • Se corrige la excepción “Column identifier is already registered” cuando se usa count_distinct_optimization con la cláusula QUALIFY. #98433 (Alexey Milovidov).
  • Se corrigió la excepción “cannot be inside Nullable type” al usar IN/NOT IN con argumentos de columna LowCardinality (p. ej., a NOT IN (b) donde a es LowCardinality(String)). #98443 (Alexey Milovidov).
  • Se corrigió la excepción “Pipeline stuck” en los JOIN full_sorting_merge, causada por un interbloqueo en PingPongProcessor cuando la optimización FilterBySetOnTheFly creó una dependencia circular con MergeJoinTransform. #98454 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR “Projection cannot increase the number of rows in a block” al fusionar partes con un TTL que elimina todas las filas y una proyección de agregación con una clave GROUP BY constante. #98458 (Alexey Milovidov).
  • Se corrige una excepción por error lógico cuando CROSS JOIN se usa junto con INNER JOIN USING. #98459 (Alexey Milovidov).
  • Se corrige una desreferenciación de puntero nulo en dictGetOrDefault cuando el argumento de la clave es Nullable. #98460 (Alexey Milovidov).
  • Corrige una excepción en consultas DISTINCT al usar proyecciones de agregación cuando materialize provoca diferencias de tipo LowCardinality entre la consulta y la proyección. #98462 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR cuando se usa arrayJoin en una expresión de filtro con OUTER JOIN y join_use_nulls activado. #98464 (Alexey Milovidov).
  • Se corrigió la excepción de error lógico “La réplica decidió leer en modo WithOrder, no en ReverseOrder” al usar réplicas paralelas con optimize_aggregation_in_order. #98467 (Alexey Milovidov).
  • Se corrigió un problema por el que ClickHouse Keeper desconectaba a los clientes Java de ZooKeeper después de la solicitud addWatch. El cliente Java espera un cuerpo ErrorResponse de 4 bytes en la respuesta de addWatch, pero Keeper estaba enviando un cuerpo vacío, lo que provocaba EOFException y la desconexión de la sesión. Esto rompía CuratorCache de Apache Curator y cualquier aplicación Java que usara watches persistentes. Corrige #98079. #98499 (Antonio Andelic).
  • Se corrige que las métricas de Keeper zk_followers y zk_synced_followers no disminuyeran cuando un follower deja de estar disponible. Se añaden las nuevas métricas zk_learners y zk_synced_non_voting_followers al comando de cuatro letras mntr. Corrige #54173. #98504 (Antonio Andelic).
  • Se corrigió una excepción LOGICAL_ERROR en renameAndCommitEmptyParts que podía producirse cuando TRUNCATE TABLE se ejecutaba de manera concurrente con OPTIMIZE TABLE usando transacciones de MergeTree. #98508 (Alexey Milovidov).
  • Se corrigió un problema por el que el puerto seguro de Raft de Keeper ignoraba cipherList y dhParamsFile de la configuración de openSSL, y siempre usaba los valores predeterminados en lugar de los especificados por el usuario. Cierra #51188. #98509 (Antonio Andelic).
  • Se corrigieron mensajes de log de Keeper engañosos, como “Recibir la solicitud de la sesión X tomó 9963 ms”, donde el tiempo informado en realidad se invertía en esperar inactivo en poll() entre latidos, y no en realizar la operación en sí. Corrige #79026. #98510 (Antonio Andelic).
  • Corrige un resultado inesperado con read_in_order_use_virtual_row y funciones monótonas; cierra #97837. #98514 (Vladimir Cherkasov).
  • Se corrige LOGICAL_ERROR: Not-ready Set is passed as the second argument for function 'in' al usar PREWHERE con una subconsulta IN en tablas MergeTree. #98522 (Alexey Milovidov).
  • Se corrigen las conexiones TCP de Keeper que, al no responder a la señal de apagado, impedían el cierre ordenado del servidor. #98525 (Alexey Milovidov).
  • Se corrige la excepción “No se encontró la columna de ordenación entre las salidas de ActionsDAG” cuando query_plan_convert_join_to_in está habilitado con query_plan_merge_expressions = 0. #98526 (Alexey Milovidov).
  • Se corrige un fallo en el origen de diccionario de MongoDB con named collections. Cierra #97840. #98528 (Pablo Marcos).
  • Se corrigió LOGICAL_ERROR cuando Identifier queda vacío tras la sustitución de parámetros. #98530 (Pervakov Grigorii).
  • Se corrige un bloqueo mutuo en el pipeline al usar sort_overflow_mode = 'break' junto con funciones de ventana. #98543 (Alexey Milovidov).
  • Se corrigió la reversión de columnas en el motor Buffer al gestionar una excepción al agregar un bloque nuevo. La lógica anterior podía provocar un estado de las columnas en memoria corrupto. #98551 (Pavel Kruglov).
  • Se corrigió la excepción Bad cast from type ColumnConst to ColumnDynamic en la comparación null-safe (<=> / IS NOT DISTINCT FROM) con columnas const Dynamic o Variant y NULL. También se corrigió que IS DISTINCT FROM con Dynamic/Variant frente a NULL devolvía siempre 0 de forma incorrecta. #98553 (Alexey Milovidov).
  • Se corrigió el uso del índice de texto con otros índices de omisión. Anteriormente, podían producirse errores lógicos como “Trying to get non-existing mark” cuando un filtro de consulta utilizaba simultáneamente un índice de texto y otros índices de omisión convencionales. #98555 (Anton Popov).
  • Se corrige el error lógico “TABLE_FUNCTION is not allowed in expression context” cuando una función de tabla con alias aparece varias veces en el mismo ámbito de la consulta (por ejemplo, en las cláusulas PREWHERE y QUALIFY). #98557 (Alexey Milovidov).
  • Corrige el análisis distribuido de índices con expresiones (no solo columnas) en la PK (lo que provoca que no se filtren gránulos redundantes en réplicas remotas). #98561 (Azat Khuzhin).
  • Impedir la eliminación de una columna cuando sus subcolumnas se utilicen en expresiones default/alias de otras columnas, y usar el analizador para las expresiones default en alter drop column. #98569 (Nikita Mikhaylov).
  • Se corrigió el reintento incorrecto de solicitudes de S3 ante errores no reintentables (incluido HTTP_CONNECTION_LIMIT_REACHED) en el client HTTP. #98598 (Sema Checherinda).
  • Se corrige un desbordamiento decimal al aplicar la poda de particiones con DateTime64. #98628 (Yarik Briukhovetskyi).
  • Corrige dos errores en la compilación JIT de expresiones: un error de copia y pega en la verificación de tipos de nativeCast que hacía inalcanzables las ramas de conversión de entero a entero y de float a float, y un TargetMachine nulo (nullptr) incorrecto pasado a LLVM PassBuilder, lo que impedía registrar las pasadas de optimización específicas del destino. #98660 (Alexey Milovidov).
  • Corrige una elusión de RBAC que permitía a los usuarios ejecutar DESCRIBE sobre cualquier tabla mediante remote(), remoteSecure(), cluster() o clusterAllReplicas() apuntando a localhost, sin requerir el privilegio SHOW_COLUMNS. #98669 (pufit).
  • Corrige la excepción BAD_GET y los resultados de consulta incorrectos cuando se usa una expresión no booleana (p. ej., sin(col)) tanto en WHERE como en SELECT con un JOIN, debido a que la optimización de push-down de filtros corrompe nodos DAG compartidos. #98681 (Alexey Milovidov).
  • Corrige LOGICAL_ERROR “La réplica decidió leer en modo Default, no en WithOrder” al usar read_in_order_through_join con réplicas paralelas. #98685 (Alexey Milovidov).
  • Corrige la excepción “Bad cast from type DB::TableFunctionNode to DB::QueryNode” al usar la función de tabla input como argumento de remote. #98694 (Alexey Milovidov).
  • Corrige la resurrección de partes de datos obsoletas causada por la limpieza incorrecta de partes vacías que las cubren. #98698 (Shaohua Wang).
  • Corrige una excepción en LogicalExpressionOptimizerPass cuando una función booleana en una comparación equals devuelve un tipo Variant. #98712 (Alexey Milovidov).
  • Se corrige que parseDateTimeBestEffort analizara incorrectamente palabras que comienzan con prefijos de nombres de meses o días de la semana. Cierra #97965. #98742 (Pavel Kruglov).
  • Corrige la excepción UNKNOWN_IDENTIFIER al consultar la table function merge() o el engine Merge en tablas con columnas JSON que tienen parámetros distintos (p. ej., diferentes campos SKIP) y columnas ALIAS que hacen referencia a subrutas de JSON, cuando está habilitado el nuevo analizador. Cierra #97812. #98753 (Pavel Kruglov).
  • Se corrige la optimización optimize_skip_unused_shards del analizador cuando se usa el motor Distributed en una View. #98754 (Nikolai Kochetov).
  • Corrige el acceso por nombre a las subcolumnas de tuplas (p. ej., SELECT x.a para Tuple(a UUID, b Int32)) en las tablas externas pasadas mediante --external en clickhouse-client. Cierra #96925. #98755 (Pavel Kruglov).
  • Se corrigió la excepción de reverseUTF8 con entradas UTF-8 no válidas (truncadas). #98770 (Alexey Milovidov).
  • Corregida la detección de la utilidad del índice de omisión Set con un predicado OR con false (es decir, or(x, 0)). #98776 (Azat Khuzhin).
  • Corrige una excepción LOGICAL_ERROR (desajuste en la estructura de bloques en removeUnusedColumns) que podía producirse con FINAL + PREWHERE + una expresión WHERE constante + agregaciones independientes de las columnas, como count(). #98778 (Alexey Milovidov).
  • Las entradas de system.trace_log para las recargas automáticas de diccionarios de ClickHouse ahora tienen identificadores de consulta no vacíos. #98784 (Miсhael Stetsyuk).
  • Corrige un fallo en el que podíamos desreferenciar un puntero nulo en tablas del sistema creadas entre el momento en que tomábamos una instantánea de las tablas en la llamada a IDatabaseTablesIterator::table() y el momento en que esas tablas cambiaban en otro hilo durante una iteración posterior. #98792 (Grant Holly).
  • Se corrige un problema por el que SYSTEM START REPLICATED VIEW no activaba la tarea de actualización. #98797 (Pablo Marcos).
  • Corrige la excepción “Inconsistent table names” al usar la función de tabla view() con JOINs dentro de otro JOIN (solo con el analizador antiguo). #98809 (Alexey Milovidov).
  • Se corrige el ajuste de RLIMIT_SIGPENDING (mediante pending_signals). #98829 (Azat Khuzhin).
  • Se corrige una excepción al combinar loop con funciones de tabla de clúster. #98860 (Konstantin Bogdanov).
  • LEFT ANTI JOIN con múltiples columnas de clave de JOIN devolvía resultados incorrectos cuando enable_join_runtime_filters=1 (que es el valor predeterminado). #98871 (Alexander Gololobov).
  • Se corrige WITH FILL STALENESS, que producía filas adicionales rellenadas al leer los datos en varios fragmentos (p. ej., con index_granularity pequeño). #98895 (Alexey Milovidov).
  • Se corrige el error lógico “RPNBuilderFunctionTreeNode has A arguments, attempted to get argument at index B” LOGICAL_ERROR. #98900 (Azat Khuzhin).
  • Corrige el desajuste en el seguimiento de memoria causado por asignaciones fallidas que no se revertían, el comportamiento indefinido de nallocx(0) y un error de una unidad en el seguimiento del pico global. Amplía el seguimiento para abarcar los búferes circulares de io_uring. #98915 (Antonio Andelic).
  • Prohibir adjuntar tablas locales de lago de datos fuera de las rutas del usuario, no solo crearlas. #98936 (Daniil Ivanik).
  • Se corrige una condición de carrera que podía causar la excepción “ReadBuffer is canceled” en consultas que usan urlCluster o funciones de tabla de clúster similares. #98955 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR en las funciones financieras (financialNetPresentValue, financialInternalRateOfReturn, etc.) al pasar argumentos de tipo BFloat16. #98958 (Alexey Milovidov).
  • Se corrigen los skip indexes (y las condiciones de la clave primaria) que no se aplicaban a las columnas ALIAS cuando la fusión de expresiones del plan de consulta está deshabilitada (query_plan_merge_expressions = 0 o query_plan_enable_optimizations = 0). #98960 (Peng).
  • Incrementa el evento de perfil InsertQuery para inserciones asíncronas. Cierra #98626. #98962 (Narasimha Pakeer).
  • Corrige la excepción “Comportamiento inconsistente de KeyCondition” en compilaciones de depuración cuando la clave primaria contiene valores NaN de coma flotante, haciendo que accurateLess y accurateEquals manejen NaN de forma coherente con el orden de ordenación de ClickHouse. Cierra #98075. #98964 (Alexey Milovidov).
  • SummingMergeTree ya no suma las columnas de tipo Bool (ni las de otros tipos de dominio). Los valores Bool se conservan tal cual, en lugar de sumarse aritméticamente. #98976 (Yash ).
  • Corrige la excepción Scalar doesn’t exist que se producía al ejecutar una consulta en un segmento remoto con optimize_const_name_size activado y enable_scalar_subquery_optimization = 0. Las constantes grandes sustituidas por referencias __getScalar en la consulta remota no se enviaban al segmento, lo que hacía que la consulta fallara. #98979 (andriibeee).
  • Corrige NOT_FOUND_COLUMN_IN_BLOCK en algunas consultas con GROUP BY y expresiones que incluyen búsquedas inversas en diccionarios, comparaciones de conversión Date/DateTime y comparaciones de tuplas. Cierra #98888. #98980 (Nihal Z. Miaji).
  • Se corrigió un comportamiento indefinido (desreferenciación de un puntero nulo) al cambiar una columna version/sign/is_deleted a EPHEMERAL o ALIAS en motores MergeTree. Ahora, esos cambios se rechazan correctamente. #98985 (Alexey Milovidov).
  • Se corrigió un problema por el que system.grants omitía, en la columna access_object, los parámetros de expresiones regulares de los privilegios URL y S3. #98987 (DQ).
  • Se corrigieron las lecturas de Iceberg BigLake: las credenciales de ADC ahora se reenvían al client S3 de GCS (lo que corrige errores 403), las credenciales de OAuth2 ahora se codifican para URL antes de enviarse (lo que corrige fallos de autenticación en tokens con caracteres especiales) y el recorrido del espacio de nombres ya no se aborta ante respuestas HTTP 400 de BigLake. #98998 (Nikita Fomichev).
  • Se corrigió un problema por el que clickhouse-client no podía cambiar la zona horaria cuando la variable de entorno TZ usa la sintaxis de ruta de archivo de POSIX (por ejemplo, TZ=:/etc/localtime). #99000 (Yash ).
  • Corrige la poda incorrecta o insuficiente cuando se usan startsWith, LIKE y NOT LIKE con una columna FixedString. Además, la función de conversión de tipo de FixedString a String ahora puede podar gránulos cuando se aplica sobre la columna clave. Cierra #98940. #99001 (Nihal Z. Miaji).
  • Se corrigió windowFunnel con strict_deduplication, que devolvía un Level incorrecto al encontrar un evento duplicado. #99003 (Yash ).
  • Corrige un error por el que EXISTS ignoraba las cláusulas LIMIT y OFFSET en las subconsultas, lo que provocaba resultados incorrectos cuando la subconsulta no devolvía ninguna fila debido a un OFFSET o a un límite de cero. Cierra #88722. #99005 (andriibeee).
  • Se corrige la excepción “Block structure mismatch” cuando la optimización de push-down de filtros encuentra una expresión AND que se cortocircuita a una constante con GROUPING SETS. #99010 (Alexey Milovidov).
  • Se corrige una excepción al leer partes de parche (actualizaciones ligeras) cuando el plan de consulta no incluye la columna _part_offset. #99023 (Alexey Milovidov).
  • Una consulta como SELECT * FROM table WHERE pk_id = '', donde pk_id es la clave primaria y es de tipo String, ahora usará correctamente el índice de clave primaria para filtrar gránulos. #99027 (Shankar Iyer).
  • Se corrigió la excepción DEPENDENCIES_NOT_FOUND en el motor Kafka cuando la vista materializada se desacopla mientras el hilo en segundo plano está transmitiendo datos. #99028 (Alexey Milovidov).
  • Corregida una excepción al crear una tabla con una columna EPHEMERAL con el mismo nombre que una columna virtual (p. ej., _part_offset). #99031 (Alexey Milovidov).
  • Corrige el confuso “inflate failed: error de búfer” al leer archivos comprimidos inexistentes mediante la función de tabla url() con patrones glob. Ahora devuelve un resultado vacío, como se esperaba, cuando http_skip_not_found_url_for_globs está habilitado. #99034 (Alexey Milovidov).
  • Se corrige un fallo del servidor (std::terminate) al ejecutar ALTER TABLE ... DROP PART en una patch part tras un cambio de esquema (p. ej., ADD COLUMN). El fallo se producía por la ausencia de columnas del sistema (_part) en los metadatos de la parte de cobertura vacía, lo que provocaba una excepción no capturada dentro de un NOEXCEPT&#95;SCOPE. #99036 (Peng).
  • El proceso del servidor ClickHouse podía bloquearse si se producía una excepción por excederse el límite de memoria durante una lectura de disco en caché. Esto ya se ha corregido. #99042 (Shankar Iyer).
  • Corrige LOGICAL_ERROR al consultar una tabla que tiene tanto una ROW POLICY como una columna ALIAS al usar dictGet. El problema se debía a un acceso prematuro a la expresión de la tabla durante la resolución de la columna ALIAS en el nuevo analizador. #99065 (Peng).
  • Corrige un error por acceso fuera de rango cuando el usuario intenta consultar solo columnas virtuales de una tabla Iceberg con los datos en formato Avro. Es un caso extremadamente raro, así que no se marca como crítico. Corrige #88238. #99080 (alesapin).
  • Se corrigió un fallo de segmentación en una CTE recursiva con remote() + view(). #99081 (Konstantin Bogdanov).
  • Se omite el análisis adicional de índices innecesario cuando se aplica la optimización de lectura en orden. #99084 (Vladimir Cherkasov).
  • Se corrigió un fallo causado por una excepción por límite de memoria lanzada durante la aplicación de un patch part. #99086 (Anton Popov).
  • Se corrigió una aserción de depuración en DDLWorker provocada por un first_failed_task_name obsoleto después de que se eliminara una entrada de ZooKeeper durante la recuperación tras la reinicialización. #99099 (Antonio Andelic).
  • Se corrigió la reconstrucción de los índices de texto en las fusiones con TTL. #99107 (Anton Popov).
  • Corrige un fallo en la consulta ALTER TABLE ... REMOVE SETTINGS para el motor de tabla Iceberg. Corrige #86330. #99108 (alesapin).
  • Corrige un error en la optimización query_plan_convert_any_join_to_semi_or_anti_join, que devolvía un resultado incorrecto para las filas sin coincidencia. Relacionado: https://github.com/ClickHouse/ClickHouse/pull/95995. #99112 (Yarik Briukhovetskyi).
  • Se corrige la excepción LOGICAL_ERROR en ASTColumnsExceptTransformer::transform. #99119 (Pablo Marcos).
  • Corrige una evasión de RBAC que permitía a los usuarios obtener la estructura de la tabla mediante DESCRIBE TABLE o CREATE TABLE AS en funciones de tabla (mysql(), postgresql(), sqlite(), arrowFlight(), jdbc(), odbc(), etc.) sin los privilegios de acceso al origen necesarios. En funciones que infieren el esquema desde servidores remotos, esto también permitía desencadenar conexiones salientes (SSRF) sin autorización. #99122 (pufit).
  • Se corrigió el fallo de Keeper (segfault en NuRaft) durante la reconfiguración dinámica y la transferencia de liderazgo. #99133 (JIaQi Tang).
  • Corrige un fallo al usar una tabla Buffer con SAMPLE cuando el destino no lo admite. #99141 (Kseniia Sumarokova).
  • Se corrige el LOGICAL_ERROR causado por una discrepancia en el orden de las columnas de las partes de parche. #99164 (Pablo Marcos).
  • Se corrige un cierre inesperado muy poco frecuente cuando una tabla Iceberg contiene archivos en formatos mixtos (ORC y Parquet). Corrige #88126. #99168 (alesapin).
  • Se corrigió un problema por el que max_execution_time no se aplicaba a las operaciones de copia de seguridad/restauración. #99205 (Kseniia Sumarokova).
  • Se corrigió un problema por el que insert_deduplication_token se ignoraba silenciosamente en las consultas INSERT SELECT sin ORDER BY ALL. Anteriormente, la deduplicación estaba completamente deshabilitada para los INSERT SELECT sin ordenar, incluso cuando se proporcionaba un token de usuario explícito. Ahora, proporcionar insert_deduplication_token basta para habilitar la deduplicación independientemente de ORDER BY ALL. #99206 (Desel72).
  • Se corrigen las comprobaciones de acceso excesivas durante la optimización InverseDictionaryLookupPass al comprobar el privilegio CREATE_TEMPORARY_TABLE una sola vez antes de la pasada, en lugar de hacerlo en cada nodo visitado. #99210 (Mikhail Artemenko).
  • Corrige un problema por el que clickhouse format --obfuscate producía SQL no válido al ofuscar tipos de skip index, nombres de códecs de compresión, nombres de motores de base de datos y definiciones de layout/source de diccionarios. #99260 (Raúl Marín).
  • Se corrigió un error por el que, en algunos casos, la comparación entre los tipos Time[64] y DateTime[64] resultaba confusa; ahora, en casos como este, los valores de Time[64] se convierten en DateTime[64] al añadir 1970-01-01 como parte de la fecha. #99267 (Yarik Briukhovetskyi).
  • Limitar las restricciones de configuración en el worker de DDL para las consultas DDL distribuidas. #99317 (Pablo Marcos).
  • Corrige pequeños problemas en la autenticación TOTP: la opción de CLI --one-time-password con contraseña vacía y la validación de los valores de configuración <digits> y <period>. #99322 (Vladimir Cherkasov).
  • Se corrige el error lógico unordered_map::at: key not found en el formato de salida Avro al serializar columnas Enum8/Enum16 con valores no presentes en la definición del enum. #99332 (Desel72).
  • Se corrige CHECK TABLE con serialización dispersa en Tuple con Dynamic. Cierra #96588. #99351 (Pavel Kruglov).
  • Se corrigió una validación excesivamente estricta del preprocesador del índice de texto. #99359 (Anton Popov).
  • Se corrige un problema de compatibilidad al actualizar tablas replicadas con índices minmax implícitos de la versión 25.10 a versiones más recientes. #99392 (Raúl Marín).
  • Se eliminó la compatibilidad con las funciones negadas (notEquals, notLike, notIn) en el análisis del índice de texto. Estas funciones nunca podían descartar ningún gránulo, por lo que su análisis en el índice solo añadía sobrecarga sin aportar ningún beneficio. #99393 (Anton Popov).
  • Corrige optimize_skip_unused_shards con el nuevo analizador para el caso en que se usaba una tabla Distributed dentro de una subconsulta con IN. #99436 (Nikolai Kochetov).
  • Se corrige un error de tipo heap-use-after-free en INTERSECT/EXCEPT cuando la consulta produce nombres de columna duplicados. #99471 (Alexey Milovidov).
  • Se corrige un error lógico en ALTER TABLE ... DROP PART cuando se utiliza un parámetro de consulta tipado para el nombre de la parte. #99489 (Alexey Milovidov).
  • Se corrigió la excepción NOT_FOUND_COLUMN_IN_BLOCK cuando se hacía referencia a un predicado de índice de texto (p. ej., hasAllTokens) tanto en las cláusulas SELECT como en WHERE mediante un alias. #99504 (Anton Popov).
  • Corrige los resultados incorrectos al usar hasAllTokens con OR entre columnas que tienen índices de texto separados. #99505 (Anton Popov).
  • Inicializar la caché de páginas en clickhouse-local para que la opción page_cache_max_size surta efecto. #99510 (Alexey Milovidov).
  • Se corrigió un caso poco frecuente en el que una parte de datos se marcaba incorrectamente como dañada y se desasociaba después de la consulta DETACH/ATTACH TABLE. #99529 (Anton Popov).
  • Soluciona la excepción std::length_error al consultar tablas del sistema vacías con el formato Pretty a través de la interfaz HTTP. #99541 (Alexey Milovidov).
  • Se corrigió LOGICAL_ERROR al usar ALTER TABLE ADD COLUMN para crear una columna EPHEMERAL con el mismo nombre que una columna virtual (p. ej., _part_offset). #99549 (Alexey Milovidov).
  • Se corrigió un problema por el que las entradas de VectorSimilarityIndexCache nunca se expulsaban tras eliminar una parte, debido a claves de caché inconsistentes. #99575 (Seva Potapov).
  • Se prohíbe la lectura de credenciales de Google desde un archivo local. Esta configuración es insegura porque permite leer otras credenciales si se conoce la ruta del archivo. #99584 (Konstantin Vedernikov).
  • Se corrige la degradación del rendimiento en el analizador. Se eliminan de ARRAY JOIN las columnas no utilizadas. #99587 (Dmitry Novik).
  • Se corrigió la lectura del índice de texto en tablas con eliminaciones ligeras y políticas de fila ya existentes. #99661 (Anton Popov).
  • Se corrige una desreferenciación de nullptr en el lector de Parquet cuando la ruta filter-in-decoder encuentra páginas descartadas por el filtro. Cierra #99676. #99677 (Alexey Milovidov).
  • Corrige una operación de seek incorrecta en AsynchronousReadBufferFromFileDescriptor con O_DIRECT. Cierra #99358. #99678 (Pavel Kruglov).
  • Se corrigió un heap-buffer-overflow en CompressionCodecT64 y un aborto del proceso en CompressionCodecMultiple al descomprimir datos comprimidos malformados. Ambos problemas fueron detectados por nuevos targets de libFuzzer. Los códecs ahora lanzan una excepción en lugar de bloquearse. #99680 (Rahul).
  • Retrasar el procesamiento hasta que el servidor termine de cargar todas las tablas. #99700 (Seva Potapov).
  • Se corrigió que la fuente de diccionario MySQL omitiera RemoteHostFilter con params de DDL en línea. #99720 (Shaohua Wang).
  • Se corrige un error lógico al iterar sobre tablas de lago de datos en system.tables. #99739 (Konstantin Vedernikov).
  • Se corrigió el análisis de predicados con la función IN en el índice de texto con preprocesador. Se corrigió la colisión entre los tokens buscados en el índice de texto, que podía dar lugar a resultados incorrectos. #99755 (Anton Popov).
  • Se corrige un bucle infinito al leer archivos en formato Npy con dimensiones negativas en la forma. #99812 (Desel72).
  • Corrige un desbordamiento global de búfer en la función CRC32 con argumentos FixedString al evaluarse con cero filas durante el cálculo de la cabecera del plan de consulta. #99835 (Alexey Milovidov).
  • Se corrige un bloqueo (desreferenciación de puntero nulo) al ejecutar ALTER TABLE ... MODIFY COLUMN ... COMMENT en tablas Iceberg. #99838 (Desel72).
  • Se corrigió la configuración aggregate_functions_null_for_empty para que funcione con funciones de agregación que devuelven tipos no Nullable, como Array o Map (por ejemplo, groupArray, sumMap). #99839 (Alexey Milovidov).
  • Se corrigió la excepción LOGICAL_ERROR en la función midpoint al llamarla con tipos enteros mixtos con y sin signo. #99867 (Alexey Milovidov).
  • Se corrige la excepción “Block structure mismatch” en consultas con cláusula HAVING en las que la expresión de filtro contiene tanto una agregación envuelta en una función que devuelve NULL como materialize(0). #99915 (Alexey Milovidov).
  • Se corrige un error de aserción en sipHash128Keyed (y funciones hash con clave similares) cuando el argumento de datos es un Map con claves de Array u otros tipos de Array anidados. #99921 (Alexey Milovidov).
  • Se corrigió la excepción LOGICAL_ERROR “Not-ready Set” en la función IN durante la optimización del plan de consulta mediante convertAnyJoinToSemiOrAntiJoin. #99939 (Alexey Milovidov).

mejora en compilación/pruebas/empaquetado

  • Reducir el tiempo de compilación eliminando inclusiones pesadas de cabeceras y moviendo las instanciaciones costosas de plantillas fuera de las cabeceras. #97893 (Raúl Marín).
  • Reducir el tiempo de compilación de las funciones aritméticas y de las cabeceras relacionadas reduciendo las matrices de despacho de plantillas y eliminando inclusiones pesadas. #98204 (Raúl Marín).
  • Usar mongo-c-driver 2.2.2. #98304 (Konstantin Bogdanov).
  • Usar postgres REL_18_3. #98306 (Konstantin Bogdanov).
  • Habilitar el jemalloc allocator para las builds de UBSan para evitar la acumulación de RSS causada por el deficiente comportamiento de recuperación de memoria de malloc de glibc. #98444 (Alexey Milovidov).
  • Usar el name mangling v0 de Rust y eliminar los símbolos internos de la biblioteca PRQL para reducir la proliferación de nombres de símbolos procedente de las bibliotecas parser combinator. #98446 (Alexey Milovidov).
  • Añadir la suite de benchmark TPC-H y el README de TPC-DS a tests/benchmarks. #98495 (Raufs Dunamalijevs).
  • Añadir pruebas de corrección para las 99 consultas de TPC-DS. #99204 (Raufs Dunamalijevs).
  • Añadir una prueba de integración que reproduce el error de DDL CREATE TABLE + ALTER con una réplica fuera de línea (#44070), marcada como fallo esperado. #99259 (Raufs Dunamalijevs).
  • Integrar jemalloc con el prefijo je_ y eliminar el uso de --wrap del enlazador. #99342 (Azat Khuzhin).

Lanzamiento de ClickHouse 26.2, 2026-02-26. Presentación, Vídeo

Cambio incompatible con versiones anteriores

  • La deduplicación está activada de forma predeterminada para todas las inserciones. Antes estaba desactivada para las inserciones asíncronas y para las MV, pero activada para las inserciones síncronas. El objetivo es tener los mismos valores predeterminados en ambas formas de inserción. Si tiene la deduplicación desactivada explícitamente en su clúster, debe establecer explícitamente deduplicate_insert='backward_compatible_choice' para mantener el comportamiento anterior. Lo mismo sucede con deduplicate_blocks_in_dependent_materialized_views. #95970 (Sema Checherinda).
  • Se ha mejorado el formato de almacenamiento de las estadísticas. Ahora, todas las estadísticas se almacenan en un único archivo. #93414 (Anton Popov). Si no habilitaste explícitamente las estadísticas de tablas, puedes ignorar este punto.
  • Se limitan los metadatos en memoria de S3(Azure)Queue. Las tablas del sistema cambian de nombre de azure_queue a azure_queue_metadata_cache y de system.s3queue a s3queue_metadata_cache. #95809 (Kseniia Sumarokova).
  • Anteriormente, al aplicar una función a una columna Variant, se devolvía NULL de forma silenciosa cuando un subtipo de Variant era incompatible con la función; ahora se lanza una excepción, lo que puede romper consultas que dependían de ese comportamiento silencioso de NULL. #95811 (Bharat Nallan).
  • Las columnas DATE de PostgreSQL ahora se infieren como Date32 en ClickHouse (en versiones anteriores se inferían como Date, lo que provocaba un desbordamiento de los valores fuera de un rango estrecho). Se permite insertar valores Date32 de nuevo en PostgreSQL. Cierra #73084. #95999 (Alexey Milovidov).
  • La semántica de la configuración do_not_merge_across_partitions_select_final se aclaró. Anteriormente, la funcionalidad podía habilitarse automáticamente cuando la configuración no se establecía explícitamente en la configuración. Esto provocó confusión en repetidas ocasiones y, lamentablemente, dio lugar a algunos problemas en producción. Ahora, las reglas son más simples: do_not_merge_across_partitions_select_final=1 habilita la funcionalidad de forma incondicional. Si do_not_merge_across_partitions_select_final=0, el modo automático se usa solo si la nueva configuración enable_automatic_decision_for_merging_across_partitions_for_final=1; de lo contrario, no se usa. Para preservar en la medida de lo posible el comportamiento anterior, los valores predeterminados se establecieron en do_not_merge_across_partitions_select_final=0 y enable_automatic_decision_for_merging_across_partitions_for_final=1. #96110 (Nikita Taranov).
  • Al crear una tabla de S3 con columnas especificadas explícitamente, ClickHouse ahora valida que esos nombres de columna realmente existan en el esquema del archivo remoto. Las consultas que antes funcionaban con nombres de columna que no coincidían ahora fallarán en el momento de crear la tabla. Esto cierra #96089. #96194 (Konstantin Vedernikov).
  • Se prohíbe el uso de subconsultas en ORDER BY y en otras expresiones de clave de tabla. #96847 (Alexey Milovidov).
  • Se habilita apply_row_policy_after_final de forma predeterminada. Inicialmente, cuando optimize_move_to_prewhere_if_final=0, tanto ROW POLICY como PREWHERE respetaban FINAL y se aplicaban después de FINAL. Esto se vio afectado por #87303, que ignoraba optimize_move_to_prewhere_if_final para el filtro de ROW POLICY. Para corregirlo, este PR habilita la configuración apply_row_policy_after_final, introducida en #91065. Con apply_row_policy_after_final habilitado, ROW POLICY seguirá respetando FINAL de forma predeterminada, como antes. Este PR es un cambio incompatible porque modifica el comportamiento de optimize_move_to_prewhere_if_final=1. Ahora, para que ROW POLICY se aplique antes de FINAL, debe usarse apply_row_policy_after_final en lugar de optimize_move_to_prewhere_if_final. #97279 (Nikolai Kochetov).
  • El tipo Date ahora se serializa como el tipo date32 nativo de Arrow en los formatos Arrow/ArrowStream, en lugar de uint16. Herramientas como PyArrow ahora reconocerán correctamente la columna como un tipo de fecha. El comportamiento anterior puede restaurarse con la configuración output_format_arrow_date_as_uint16. Se sigue admitiendo la lectura de archivos Arrow antiguos que usaban uint16 para columnas Date. #96860 (Alexey Milovidov).

Nueva funcionalidad

  • Ahora los usuarios pueden usar ClickStack (una UI de observabilidad) directamente desde ClickHouse, lo que resulta útil para la depuración y el desarrollo local. #96597 (Aaron Knudtson).
  • Se admite la autenticación mediante contraseña de un solo uso basada en el tiempo (TOTP). #71273 (Vladimir Cherkasov).
  • Añade la configuración de la base de datos lazy_load_tables. Cuando está habilitada, las tablas no se cargan durante el arranque de la base de datos; en su lugar, se crea un StorageTableProxy ligero y el table engine real se materializa al acceder por primera vez. #96283 (xiaohuanlin).
  • Se añadió la configuración input_format_max_block_wait_ms para emitir bloques de datos al agotarse el tiempo de espera y se permitió procesar los datos restantes cuando una conexión HTTP se cierra de forma inesperada. #94509 (Mostafa Mohamed Salah).
  • Integración del catálogo de Google BigLake. Esto cierra #95339. #97104 (Konstantin Vedernikov).
  • Se añadió la tabla del sistema system.tokenizers, que muestra todos los tokenizadores disponibles. #96753 (Robert Schulze).
  • Añadir una nueva tabla del sistema system.user_defined_functions para supervisar el estado de carga y la configuración de las UDF. #90340 (Xu Jia).
  • Se añade la tabla system.jemalloc_stats, que expone estadísticas del allocator de memoria jemalloc (mediante malloc_stats_print) para diagnosticar el uso de memoria en servidores compilados con jemalloc. También se añade un endpoint HTTP /jemalloc.html en la interfaz HTTP de ClickHouse para visualizar interactivamente estas estadísticas. #97077 (Antonio Andelic).
  • Se añadió la tabla system.jemalloc_profile_text para leer y analizar perfiles del heap de jemalloc. El formato de salida se controla con la configuración jemalloc_profile_text_output_format (raw, simbolizado o collapsed; el valor predeterminado es collapsed). La resolución de frames inline se controla con jemalloc_profile_text_symbolize_with_inline (cuando está activado, los frames inline se incluyen a costa de una simbolización más lenta; cuando está desactivado, se omiten para obtener una salida más rápida). Para el formato collapsed, jemalloc_profile_text_collapsed_use_count controla si las pilas se ponderan por el número de asignaciones activas (true) o por bytes activos (false, valor predeterminado). Esto facilita el perfilado de memoria y la visualización de flame graphs a partir de perfiles del heap de jemalloc. Corrige #93248. #97218 (Antonio Andelic).
  • Añade la configuración default_dictionary_database, que permite a ClickHouse resolver los diccionarios externos a los que se hace referencia sin un calificador de base de datos dentro de una base de datos predeterminada especificada. Esto simplifica la migración de diccionarios globales definidos en XML a diccionarios definidos en SQL por base de datos, lo que permite que las consultas de diccionario existentes (p. ej., dictGet(‘name’, …)) sigan funcionando sin cambios. #91412 (Dmitrii Plotnikov).
  • Soporte para ZooKeeper auxiliar en DatabaseReplicated. #91683 (RinChanNOW).
  • Implementa la nueva función de tabla primes y la nueva tabla del sistema system.primes, que contiene números primos en orden ascendente. Cierra #90839. #92776 (Nihal Z. Miaji).
  • Los async inserts admiten quorum en paralelo. Los datos insertados se replican en el quorum. Si se detectan duplicados, la consulta espera hasta que los datos insertados previamente también se repliquen. #93356 (Sema Checherinda).
  • Se añadieron las funciones colorOKLABToSRGB, colorSRGBToOKLAB para convertir valores de sRGB a OKLAB y viceversa. #93361 (Pranav Tiwari).
  • Un nuevo ajuste deduplicate_insert que anula insert_deduplicate y async_insert_deduplicate. #94413 (Sema Checherinda).
  • La configuración del servidor insert_deduplication_version permite realizar la migración a un hash de deduplicación unificado. #95409 (Sema Checherinda).
  • Se añade la función hash xxh3_128. #96055 (Raúl Marín).
  • Se añadió la consulta OPTIMIZE <table> DRY RUN PARTS <part names> para simular merges sin hacer commit de la parte resultante. Puede ser útil para pruebas: verificar la corrección del merge en la nueva versión, reproducir de forma determinista errores relacionados con merges y hacer benchmark del rendimiento de los merges de forma fiable. #96122 (Anton Popov).
  • Añade una nueva comprobación habilitada de forma predeterminada mediante la configuración check_named_collection_dependencies para evitar eliminar colecciones nombradas utilizadas por tablas. #96181 (Pablo Marcos).
  • Se agregó system.fail_points para inspeccionar los failpoints existentes en el servidor y verificar si están habilitados o no. Esto ayudará a automatizar las pruebas. #96762 (Pedro Ferreira).
  • Añade acceso basado en roles al catálogo de Glue. Usa la configuración aws_role_arn y, opcionalmente, aws_role_session_name. #90825 (Antonio Andelic).
  • Se añadió una configuración, add_minmax_index_for_temporal_columns, que, al habilitarse, crea automáticamente índices minmax para todas las columnas Date, Date32, Time, Time64, DateTime y DateTime64. #93355 (Michael Jarrett).
  • Soporte para alias de tabla extendidos en JOINs (consultas como SELECT * FROM (SELECT 1) AS t(a) JOIN (SELECT 1) AS u(b) ON a = b). Cierra #95131. #95331 (Yarik Briukhovetskyi).
  • Se añadió compatibilidad con ALTER TABLE RENAME COLUMN para tablas Iceberg. Antes, solo se admitían ADD COLUMN, DROP COLUMN, and MODIFY COLUMN. #97455 (murphy-4o).

Funcionalidad experimental

  • El índice de texto ahora es GA. #96794 (Robert Schulze).
  • El tipo de dato QBit, para el almacenamiento vectorial cuantizado y empaquetado en bits (usado para la búsqueda aproximada de vecinos más cercanos), ahora está disponible de forma general y ya no requiere habilitar una configuración experimental. #95358 (Raufs Dunamalijevs).
  • La búsqueda vectorial en ClickHouse ahora puede usar réplicas en el clúster para distribuir la carga y la búsqueda entre las partes del índice vectorial. Esto permite que ClickHouse admita índices vectoriales grandes que superan la capacidad de memoria de una sola VM. #95876 (Shankar Iyer).
  • Se añade un AST fuzzer del servidor controlado por las configuraciones ast_fuzzer_runs y ast_fuzzer_any_query. Cuando está habilitado, el servidor ejecuta mutaciones aleatorias de cada consulta después de su ejecución normal y descarta los resultados. #97568 (Alexey Milovidov).
  • Se añade la función iif al dialecto KQL experimental. #94790 (happyso).
  • La inferencia de esquema ahora tiene en cuenta allow_experimental_nullable_tuple_type. Cuando está habilitado, permite que los tipos de tupla inferidos sean Nullable(Tuple(...)), de modo que los objetos anidados que falten puedan convertirse en NULL en lugar de en una tupla de elementos NULL. #95525 (Nihal Z. Miaji).
  • La configuración use_statistics_cache ahora está habilitada de forma predeterminada, por lo que las estadísticas de columnas se almacenan en caché en memoria para acelerar la optimización de consultas sin necesidad de volver a cargarlas desde cada parte. #95950 (Han Fei).

Mejora del rendimiento

  • Permite usar cualquier expresión determinista de la clave primaria para la omisión de datos (por ejemplo, ORDER BY cityHash64(user_id)/ ORDER BY length(user_id)). En el caso de las expresiones deterministas, ClickHouse puede aplicar la expresión a las constantes de la consulta y usar el resultado en el índice de la clave primaria para predicados como =, IN y has. Si la expresión también es inyectiva (por ejemplo, ORDER BY hex(p) o ORDER BY reverse(tuple(reverse(p), hex(p)))), podemos usar eficazmente el índice para las formas negadas: !=, NOT IN y NOT has. Cierra #10685. Cierra #82161. #92952 (Nihal Z. Miaji).
  • Se ha mejorado el formato de almacenamiento de las estadísticas. Ahora, todas las estadísticas se almacenan en un único archivo. #93414 (Anton Popov).
  • Permitir la lectura en paralelo para motores de tabla y funciones remotos en la caché del sistema de archivos. #71781 (Kseniia Sumarokova).
  • Se permite usar la caché de páginas en espacio de usuario con archivos locales y con funciones de tabla de almacenamiento de objetos. #77874 (Michael Kolupaev).
  • Se evita el uso innecesario de memcpy en la caché de páginas en espacio de usuario. #77884 (Michael Kolupaev).
  • El valor predeterminado de concurrent_threads_scheduler ahora es max_min_fair en lugar de fair_round_robin. Esto mejora la equidad cuando la carga es alta al priorizar las consultas con menos slots asignados, de modo que las consultas de corta duración no se vean penalizadas por las de larga duración. #95300 (Sergei Trifonov).
  • Si una consulta FINAL usaba la condición de la clave primaria para filtrar, seguida de índices de omisión para otras condiciones, el paso de procesamiento PrimaryKeyExpand ahora solo comprobará la intersección de los rangos iniciales preseleccionados de la clave primaria. #94903 (Shankar Iyer).
  • Al usar réplicas paralelas con funciones de tabla como s3(...), las consultas con una sola subconsulta que envuelve la función de tabla ahora se paralelizan automáticamente entre las réplicas, mientras que antes solo se paralelizaban las referencias directas a funciones de tabla. Cierra #92264. #96332 (phulv94).
  • Se habilita la división en segmentos separados de los archivos de datos y del sistema de la caché. #87834 (MikhailBurdukov).
  • Se aceleran algunas operaciones de hash join al implementar despacho dinámico para ColumnVector::replicate. #79573 (Raúl Marín).
  • Mejora del rendimiento para parallel hash join en casos de predicados complejos. Anteriormente, procesábamos las filas no emparejadas en un solo hilo, lo que no es óptimo; esta optimización paraleliza el procesamiento de las filas no emparejadas en varios hilos. Se puede activar o desactivar con el ajuste parallel_non_joined_rows_processing. Activado de forma predeterminada. #92068 (Yarik Briukhovetskyi).
  • Se optimizó ligeramente el análisis del tipo JSON. #93614 (Pavel Kruglov).
  • Mejora de la huella de memoria del AST. La optimización tiene sentido, ya que los campos no se utilizan cuando no se usa el resaltado ni se analizan VALUES. #93974 (Ilya Yatsishin).
  • Optimiza el consumo de memoria de los objetos AST de Tuple con nombres. Coloca los nombres de columna como cadenas en el objeto Tuple en lugar de mantenerlos en nodos literales AST genéricos. #94704 (Ilya Yatsishin).
  • Se mejora la desvirtualización con opciones adicionales del enlazador. #94737 (Nikita Taranov).
  • Mejora el rendimiento de la clonación de réplicas para tablas ReplicatedMergeTree con muchas partes agrupando en lotes las solicitudes a ZooKeeper. #94847 (c-end).
  • Cuando la etapa de lectura ya tenía filtros PREWHERE, no se podía añadir un filtro nuevo. Este cambio pospone la optimización de PREWHERE hasta después de la optimización de filtros runtime de JOIN, para que los filtros runtime también puedan llevarse a PREWHERE. #95838 (Alexander Gololobov).
  • Acelera la compresión del códec T64 usando despacho dinámico en x86. #95881 (Raúl Marín).
  • Se acelera uniq para tipos numéricos agrupando las inserciones en lotes cuando es posible (sin NULL, sin -If, sin GROUP BY y sin IPv6 ni String). #95904 (Raúl Marín).
  • Optimizaciones de bajo nivel para Keeper: se ha detectado que ZooKeeper::observeOperations supone >20% del consumo de CPU del hilo de recepción de ZooKeeper. Este cambio lo corrige de la siguiente manera: 1. Para AggregatedZooKeeperLog::stats, se usa CityHash64 en lugar de SipHash, ya que es >10x más rápido. 2. Para Coordination::ErrorCounter, se usa std::array<std::atomic<UInt32>, N> en lugar de std::unordered_map y std::mutex. #95962 (Miсhael Stetsyuk).
  • Se eliminó la alineación de 64 bytes para ProfileEvents::Counter para ahorrar memoria. #96097 (Azat Khuzhin).
  • Optimización de memoria: reducir en 50 veces el tamaño de la estructura CachedOnDiskReadBufferFromFile. #96098 (Azat Khuzhin).
  • No copiar los datos antiguos al redimensionar la tabla hash si está vacía. #96180 (Raúl Marín).
  • Se admiten filtros de runtime de JOIN para JOINs RIGHT OUTER. #96183 (Hechem Selmi).
  • La optimización enable_join_runtime_filters ahora es la predeterminada. #89314 (Alexey Milovidov).
  • Anteriormente, la optimización direct read del índice de texto se aplicaba solo cuando todas las partes tenían un índice de texto materializado. Este PR añade compatibilidad parcial: si algunas partes tienen un índice de texto materializado, esas partes lo usarán, mientras que las partes sin un índice de texto materializado recurrirán a la expresión de filtro original. #96411 (Anton Popov).
  • Se añadieron índices secundarios minmax en las columnas de tiempo e índices bloom_filter en las columnas query_id/initial_query_id de las tablas de logs del sistema para agilizar el filtrado. #96712 (Alexey Milovidov).
  • La optimización de materialización diferida ahora se aplica a todas las ramas de una consulta UNION ALL, no solo a la primera. Las consultas que combinan varias lecturas ordenadas y limitadas de distintas tablas MergeTree mediante UNION ALL ahora se beneficiarán de la lectura diferida de columnas en cada rama, lo que reduce la E/S. #96832 (Federico Ginosa).
  • Optimiza el cálculo del skip index minmax durante INSERT eliminando una copia de datos innecesaria y habilitando el cálculo vectorizado de mínimos/máximos en columnas numéricas. #97392 (Raúl Marín).
  • El motor DeltaLake ahora toma el resultado de count() de los metadatos de Delta Lake y muestra las estadísticas correctas de la tabla en system.tables (bytes/filas totales). #96190 (Kseniia Sumarokova).
  • Las columnas no utilizadas también se eliminan del paso de lectura cuando se lee desde un MergeTree. Esto es especialmente útil cuando se hace pushdown de un filtro a PREWHERE. #89982 (János Benjamin Antal).
  • Se mejoró el procesamiento de la consulta SHOW TABLES al obtener solo los nombres de las tablas, y se mejoró getLightweightTablesIterator para que devuelva una estructura que contenga únicamente los nombres de las tablas. Resuelve #93835. #94467 (Smita Kulkarni).
  • Mejora assumeNotNull, coalesce e ifNull para permitir la poda de la clave primaria y del skip index en predicados de rango cuando las columnas clave se envuelven en estas funciones. Cierra #94689. #94754 (Nihal Z. Miaji).
  • Se añaden las extensiones with_data & with_stat a la solicitud getChildren de Keeper. Esto permite obtener no solo la lista de hijos, sino también su stat y/o data en una sola operación. #94826 (Nikolay Degterinsky).
  • El análisis de índices se realiza solo una vez (en la mayoría de los casos), independientemente de si se acaba ejecutando un plan local o uno con réplicas paralelas. #94854 (Nikita Taranov).
  • Permite habilitar el análisis distribuido de índices según la cantidad de partes (distributed_index_analysis_min_parts_to_activate) y el tamaño de los índices (distributed_index_analysis_min_indexes_size_to_activate). #95216 (Azat Khuzhin).
  • Se habilita la optimización de PREWHERE para tablas Iceberg. #95476 (Konstantin Vedernikov).
  • Se reduce el consumo de memoria de algunas clases de AST. #95514 (Raúl Marín).
  • Limita el número de flujos del pipeline generados con split_intersecting_parts_ranges_into_layers habilitado. Ayuda a evitar un consumo excesivo de memoria. #96478 (Nikita Taranov).
  • Se implementó la optimización de conjuntos equivalentes para múltiples joins. Las consultas con múltiples operaciones consecutivas de INNER JOIN ahora se benefician de una mejora en la optimización de pushdown de filtros. Cuando las tablas se unen por columnas equivalentes (p. ej., t1 JOIN t2 ON t1.id = t2.id JOIN t3 ON t2.id = t3.id WHERE t1.id > 10), los filtros aplicados a cualquier tabla de la cadena se hacen pushdown automáticamente a todas las tablas. Cierra #96550. #96596 (Vladimir Cherkasov).
  • Optimiza el escaneo de metadata de delta lake. Incorpora cambios de la PR de delta-kernel https://github.com/delta-io/delta-kernel-rs/pull/1827. #96686 (Kseniia Sumarokova).
  • En la base de datos Replicated, no actualice el clúster almacenado en caché para cada consulta de prueba. #96897 (Tuan Pham Anh).
  • Utiliza el índice de clave primaria al filtrar con startsWithUTF8 si el prefijo contiene únicamente caracteres ASCII. #97055 (vkcku).

Mejora

  • Añadir trazas de OpenTelemetry para las peticiones de Keeper. #91332 (Miсhael Stetsyuk).
  • Nuevas opciones de configuración: logger.startup_console_level & logger.shutdown_console_level para anular el nivel de registro de la consola durante el inicio y el apagado de ClickHouse, respectivamente. #95919 (Garrett Thomas).
  • Se respetan las sobrescrituras de la línea de comandos al recargar la configuración. Cierra #80294. #80295 (Alexey Milovidov).
  • Permitir sobrescrituras de clave-valor en los parámetros de named collection de la función de tabla mongodb. #89616 (vanchaklar).
  • La optimización de lectura en orden para las tablas Iceberg ahora también funciona con funciones de ordenación complejas como icebergBucket y icebergTruncate, no solo con referencias simples a columnas. #90256 (Konstantin Vedernikov).
  • Se añade una nueva columna llamada parts_postpone_reasons en system.mutations para mejorar el diagnóstico, que muestra los motivos de aplazamiento de las partes. #92206 (Shaohua Wang).
  • Seguimiento de los cambios en el número de filas que se van a leer (debido a inserciones/eliminaciones o al uso de la caché de condiciones de consulta) en DataflowStatisticsCache. #93636 (Nikita Taranov).
  • Se admite la consulta SYSTEM RESET DDL WORKER [ON CLUSTER]. Solicita restablecer el estado de DDLWorker en su thread principal. Resulta útil para refrescar la réplica activa cuando se actualizan los ID del host. #93780 (Tuan Pham Anh).
  • Se añade compatibilidad con mutation_ids en system.part_log para los tipos de evento MUTATE_PART y MUTATE_PART_START. #93811 (Shaohua Wang).
  • Las operaciones en segundo plano (Mutate, Merge) ahora pueden configurarse de forma independiente a través del perfil ‘background’. Antes, estas operaciones compartían la configuración con las consultas normales mediante el perfil ‘default’. #93905 (Arsen Muk).
  • Se añadió más información a system.crash_log. #94112 #95857 (Miсhael Stetsyuk).
  • Se añadió la nueva métrica QueryNonInternal para realizar un seguimiento del número de consultas no internas en ejecución. Esta métrica se expone como ClickHouseMetrics_QueryNonInternal y ayuda a los operadores a supervisar la concurrencia de consultas con respecto al límite max_concurrent_queries, que solo se aplica a las consultas no internas. #94284 (Ashwath Singh).
  • Se añade compatibilidad con la recopilación de estadísticas de bytes de entrada para columnas de partes compactas en RuntimeDataflowStatisticsCacheUpdater. #94626 (Nikita Taranov).
  • Añade una comprobación para detectar una configuración incorrecta de Keeper que provoca fallos en la formación del clúster. Cierra #60932. #94682 (Konstantin Bogdanov).
  • Mejorar la deserialización de prefijos JSON al cargar partes. #94848 (Pavel Kruglov).
  • Refactoriza la escritura para usar el pipeline completo de INSERT, que activa las vistas materializadas en la tabla de destino. #94890 (Kai Zhu).
  • Usar optimizaciones del plan de búsqueda por similitud vectorial solo si existe el índice para la columna de búsqueda. #94998 (Eduard Karacharov).
  • Comprobar el límite total de memoria antes de la autenticación del usuario y lanzar (total) memory limit exceeded si el límite total supera lo permitido. #95003 (Nikolai Kochetov).
  • Se añadió la opción de configuración throw_on_unmatched_row_policies que, cuando está habilitada, lanza una excepción si un usuario consulta una tabla que tiene políticas de filas pero ninguna de ellas se le aplica, lo que evita el comportamiento ambiguo de devolver todas las filas debido a una mala configuración del control de acceso. #95014 (Vitaly Baranov).
  • Actualización dinámica de los tokens de acceso de S3 en consultas largas con Unity Catalog. Esto cierra #93981. #95069 (Konstantin Vedernikov).
  • Desactiva la liberación gradual de páginas sucias de jemalloc si ClickHouse está sometido a una presión de memoria sostenida durante memory_worker_decay_adjustment_period_ms milisegundos. Vuelve a activarla si ClickHouse opera en condiciones normales durante el mismo periodo de tiempo. #95145 (Antonio Andelic).
  • Compatibilidad con ZooKeeper auxiliar para S3Queue mediante la configuración keeper_path de s3Queue. #95203 (Diego Nieto).
  • Se respeta max_parts_to_merge_at_once en las fusiones de partes con eliminación por TTL. #95315 (Kseniia Sumarokova).
  • Añadir connection_address y connection_port a query_log para reflejar la conexión física (address y port se reemplazan al conectarse a través de un proxy y auth_use_forwarded_address=1). #95471 (Yakov Olkhovskiy).
  • Corrige el cálculo incorrecto de memoria para la caché de condiciones de la consulta. El problema principal era que no se tenía en cuenta la clave de la caché, que estaba compuesta por varias cadenas (como part_name, el id de la tabla y la condición SQL completa). #95478 (Nikita Mikhaylov).
  • El servidor iniciado con la configuración integrada permitirá gestionar usuarios y permisos, guardándolos en el directorio access, igual que la configuración habitual. Esto mejora las pruebas. También se habilitaron todas las access_control_improvements en la configuración integrada y en clickhouse-local. #95481 (Alexey Milovidov).
  • Se mejoraron los mensajes de error de autenticación de S3 para incluir una indicación de revisar las credenciales cuando se deniega el acceso. #95648 (Gerald Latkovic).
  • Se habilita la caché de estadísticas y se establece el período de actualización de la caché en 300 s. #95841 (Han Fei).
  • Se añadió el nombre del componente a system.aggregated_zookeeper_log. #95882 (Antonio Andelic).
  • Omitir las lecturas desde el almacenamiento de objetos al consultar las tablas DeltaLake desde system.tables. #95899 (Antonio Andelic).
  • Se habilita enable_max_bytes_limit_for_min_age_to_force_merge de forma predeterminada si la configuración compatibility es 26.2 o superior. #95917 (Christoph Wurm).
  • Delta Lake ya está disponible en macOS. Cierra #95979. #95985 (Alexey Milovidov).
  • En versiones anteriores, al combinar expresiones ALTER en conflicto con UPDATE y RENAME COLUMN, se lanzaba un error lógico en lugar de una excepción adecuada. Cierra #70678. #96022 (Alexey Milovidov).
  • Mejora la salida de ayuda de todas las aplicaciones de ClickHouse y añade una opción --no-sudo, junto con algunas correcciones. Da continuidad a #58244 de Ilya Yatsishin. #96025 (Alexey Milovidov).
  • Se agregó el alias distanceCosine para cosineDistance, ya que todas las demás funciones de distancia ya tienen un alias de este tipo. #96065 (Raufs Dunamalijevs).
  • Se añadió compatibilidad con la extensión with_data de Keeper para mejorar la obtención de tablas en la base de datos Replicated. #96090 (Nikolay Degterinsky).
  • Se actualiza chdig a v26.2.1 (nuevas funcionalidades y compatibilidad con MacOS). #96113 (Azat Khuzhin).
  • Mejora del pushdown de filtros para numbers y primes. ClickHouse ahora puede derivar cotas conservadoras de valores a partir de las condiciones WHERE cuando no es posible derivar cotas exactas, y restringir en consecuencia la generación de secuencias (por ejemplo, para WHERE number % 5 < 2 AND number > 100 AND number < 300, ClickHouse solo generará números entre 100 y 300, y luego aplicará el predicado), evitando escaneos no acotados. Cierra #84853. Cierra #93913. #96115 (Nihal Z. Miaji).
  • Anteriormente, el formateador ponía SELECT entre paréntesis cuando había una cláusula COMMENT para evitar ambigüedades en el análisis sintáctico. En su lugar, ahora coloca COMMENT antes de AS SELECT, lo que elimina la ambigüedad sin necesidad de paréntesis. #96293 (Alexey Milovidov).
  • La opción de configuración allow_impersonate_user ahora se encuentra dentro de la sección access_control_improvements, en lugar de ser una opción de configuración del servidor independiente. #96451 (Vitaly Baranov).
  • Hacer que la opción de configuración core_dump.size_limit admita recarga en caliente, para evitar tener que reiniciar los servidores para que los cambios de configuración surtan efecto. #96524 (Miсhael Stetsyuk).
  • Mejora la interoperabilidad del perfilador de CPU y del perfilador en tiempo real con los tiempos de espera de socket. #96601 (Sergei Trifonov).
  • Evita que reaparezcan los datos eliminados si se ejecuta ADD COLUMN poco después de la mutación DROP COLUMN. #96713 (Alexey Milovidov).
  • Cambio del tipo de function_id en system.instrumentation de LowCardinality(Int32) a Int32. #96726 (Copilot).
  • La espera síncrona de las mutaciones respetará la cancelación de consultas y los límites de tiempo. #96756 (Alexey Milovidov).
  • Se añadió el comando de sistema SYSTEM RELOAD DELTA KERNEL TRACING <level> para cambiar el logging de delta-kernel, lo que puede resultar útil para la depuración. #96763 (Kseniia Sumarokova).
  • El filtrado por familia de direcciones IP, es decir, los ajustes dns_allow_resolve_names_to_ipv4/ipv6, se aplica incluso si la caché de DNS está deshabilitada. #96810 (c-end).
  • Mejora de la introspección de jemalloc. #96840 (Azat Khuzhin).
  • Se corrige la interfaz web de /play, que arrojaba QUERY_CACHE_USED_WITH_SYSTEM_TABLE al consultar tablas del sistema. #96869 (Alexey Milovidov).
  • Mejora de la interfaz web: cambiar el favicon para indicar el estado de ejecución de una consulta; mostrar los errores de las consultas auxiliares (carga de bases de datos y tablas) en lugar de ignorarlos silenciosamente. Cierra #85055. #96883 (Alexey Milovidov).
  • Se puede hacer clic en el panel izquierdo de la UI de /play para mostrar u ocultar la lista de bases de datos. #96884 (Alexey Milovidov).
  • DROP DATABASE ahora elimina las tablas en orden inverso de dependencia, lo que mejora la tolerancia a fallos cuando la base de datos contiene tablas con dependencias de carga (por ejemplo, tablas Distributed que usan joinGet). #97057 (Alexey Milovidov).
  • Actualizar yaml-cpp para evitar que se omita YAML no válido. #97333 (Azat Khuzhin).
  • Mostrar un indicador de carga en la barra lateral de play.html mientras se cargan las tablas. #97531 (Alexey Milovidov).
  • Añade un botón para copiar al portapapeles los resultados sin procesar de la consulta en la interfaz web integrada (play.html). #97532 (Alexey Milovidov).
  • Se corrige el ofuscador de consultas (clickhouse-format --obfuscate) para que genere SQL que pueda analizarse en más casos. #97584 (Alexey Milovidov).

Corrección de errores (mal funcionamiento visible para el usuario en una versión estable oficial)

  • Después de ALTER que solo afectan a los metadatos, como ampliar los elementos de los Enums, la optimización de la agregación con proyección puede terminar provocando una excepción. #84143 (Alexey Milovidov).
  • Las vistas materializadas ahora usan como contexto de ejecución la base de datos en la que se crearon, lo que significa que: - es posible omitir la calificación explícita de la base de datos en los nombres a los que se hace referencia en la consulta SELECT de la vista - si no se indica una calificación explícita de la base de datos, se asume la misma base de datos en la que se creó la vista materializada. #88193 (Dmitry Kovalev).
  • Corrige la sustitución de parámetros de consulta en los métodos de autenticación de CREATE USER cuando se usa ON CLUSTER. Los parámetros de consulta en los métodos de autenticación (p. ej., password) no se sustituían, lo que provocaba errores UNKNOWN_QUERY_PARAMETER en nodos remotos. #92777 (xiaohuanlin).
  • Se corrigieron inconsistencias en el análisis de índices de texto para las funciones has, mapContainsKey y mapContainsValue. Anteriormente, las consultas que usaban estas funciones podían devolver resultados distintos dependiendo de si la expresión se evaluaba con o sin un índice de texto. #93578 (Anton Popov).
  • Se corrige un fallo al adjuntar una tabla a una base de datos MaterializedPostgreSQL si dropReplicationSlot lanza una excepción durante el desenrollado de la pila. #96871 (Alexey Milovidov).
  • Las copias de seguridad podían hacer que el servidor fallara si se ejecutaban muchas copias de seguridad concurrentes que competían por los mismos archivos. #93659 (Alexey Milovidov).
  • Corrige las consultas con réplicas paralelas y un JOIN con una tabla no MT. Cierra #92056. #93902 (Igor Nikonov).
  • Corrige un problema por el cual las columnas de Iceberg con un punto en el nombre devolvían NULL como valor. #94335 (Mikhail Koviazin).
  • Se corrigió el manejo de cadenas UTF-8 en stringJaccardIndexUTF8 y se mejoró el rendimiento. #94613 (Joanna Hulboj).
  • Corrige posibles desbordamientos en WITH FILL STALENESS (que provocan UB y/o bucles infinitos). Corrige un posible bucle infinito debido a saltos grandes. Añade compatibilidad con el analizador antiguo (principalmente para pruebas de estrés). #94663 (Azat Khuzhin).
  • Se corrigen posibles consultas distribuidas que pueden quedar bloqueadas cuando los nombres de host se resuelven en varias direcciones y una réplica remota se congela. #94726 (c-end).
  • Corrige un resultado no válido al unir varias expresiones de tabla, cuando la expresión de tabla más a la izquierda es una función de tabla -Cluster. Resuelve #89996. #94748 (Konstantin Bogdanov).
  • Corrige la poda incorrecta de la clave primaria y del índice de omisión para predicados que involucran toWeek, toYearWeek, toStartOfWeek, toLastDayOfWeek y toDayOfWeek, y corrige excepciones en algunas de estas funciones para consultas válidas con LowCardinality(String). #94816 (Nihal Z. Miaji).
  • Se elimina la omisión innecesaria de la comprobación de permisos en las consultas ATTACH para una vista con SQL Security. Esto evita una posible escalada de privilegios cuando un usuario adjunta una vista con un definidor sin validar el acceso requerido. #94865 (pufit).
  • Corrige un fallo al iniciar ReplicatedMergeTree causado por la eliminación simultánea de los directorios delete_tmp_*. #94892 (myeongjun).
  • Se corrige un problema por el que INSERT en tablas Iceberg con vistas materializadas perdía información de deduplicación, lo que provocaba una excepción. #94938 (Daniil Ivanik).
  • Corrige un error por el que SYSTEM DROP QUERY CACHE TAG 'TAGNAME' ON CLUSTER <CLUSTERNAME> hacía que se eliminara toda la caché del clúster. #94978 (Rory Crispin).
  • Mantener la granularidad constante del índice (use_const_adaptive_granularity) tras las fusiones verticales (v2 con una corrección para Nested y en general). #95013 (Azat Khuzhin).
  • Corrige una condición de carrera en la caché del sistema de archivos en la versión 26.1 tras [ClickHouse/ClickHouse#82764](https://github.com/ClickHouse/ClickHouse/pull/82764). #95042 (Kseniia Sumarokova).
  • Se corrige la cancelación de la table function postgresql() mediante KILL QUERY y la cancelación de consultas (Ctrl+C) en clickhouse-client. #95136 (Roman Vasin).
  • Se corrigió la inferencia de tipos para columnas calificadas de tablas de origen cuando se usan varios joins con la cláusula USING. Anteriormente, los joins posteriores actualizaban incorrectamente los tipos de las columnas subyacentes de las tablas de origen a un supertipo común, incluso cuando la columna no intervenía en ese join (p. ej., en SELECT t2.a FROM t1 LEFT JOIN t2 USING (a) LEFT JOIN t3 USING (a), la columna t2.a solo se usa en el primer join, por lo que su tipo debería ser el supertipo de t1.a y t2.a, excluyendo t3.a). Esto podía provocar errores lógicos o fallos cuando las funciones esperaban tipos de columna distintos de los que realmente aparecían en el plan de ejecución. #95157 (Vladimir Cherkasov).
  • Hacer que la transformación de la columna se realice solo una vez al obtener el contenido de la lista y de los archivos .avro del manifiesto. #95164 (Daniil Ivanik).
  • Se corrigió un cálculo incorrecto del tamaño de las columnas JSON que podía provocar un uso excesivo de memoria o estadísticas de columnas erróneas. #95207 (Azat Khuzhin).
  • Se corrigió la contabilización inexacta de memoria al aplicar partes de parche grandes después de actualizaciones ligeras. Anteriormente, aplicar parches grandes podía provocar un uso excesivo de memoria y hacer que el proceso del servidor fuera finalizado por el OOM killer. #95231 (Anton Popov).
  • Se corrigió un comportamiento indefinido que podía provocar resultados incorrectos o una excepción cuando una consulta distribuida con max_parallel_replicas volvía a una réplica local durante el análisis de índices. #95263 (Azat Khuzhin).
  • Se corrige la agregación de columnas dispersas para sum y las series temporales cuando group_by_overflow_mode se establece en any. #95301 (Mikhail Koviazin).
  • Corrige un problema de fiabilidad en la política de disco plain_rewritable, donde un error de red a mitad del proceso de desvincular un archivo de metadatos podía dejar el almacenamiento en un estado incoherente. #95302 (Mikhail Artemenko).
  • Se sustituye Date por Date32 para Iceberg. #95322 (Konstantin Vedernikov).
  • El argumento password de la función de tabla redis ahora se enmascarará en los logs y las tablas del sistema (p. ej.: query_log). #95325 (János Benjamin Antal).
  • Se corrigió un error por el que las tablas podían eliminarse o modificarse mientras una consulta distribuida seguía ejecutándose en ellas, lo que podía provocar excepciones o resultados incorrectos. #95356 (Azat Khuzhin).
  • Se corrige un error lógico en algunos casos al usar LIMIT/OFFSET negativo en consultas distribuidas. #95357 (Nihal Z. Miaji).
  • Se corrigió un error por el que clickhouse-client pedía la contraseña dos veces al conectarse por ssh. #95372 (Isak Ellmer).
  • Se corrige una condición de carrera en el almacenamiento S3(Azure)Queue. #95385 (Kseniia Sumarokova).
  • Corrige el error del filtro de prewhere causado por expresiones lambda en prewhere. #95395 (Xiaozhe Yu).
  • Se corrige optimize_syntax_fuse_functions para que no reescriba sum/count/avg como sumCount() cuando el argumento de agregación es Nullable. Cierra #95390. #95441 (Nihal Z. Miaji).
  • Se evita un posible fallo en las consultas distribuidas en caso de cancelación. #95466 (Aleksandr Musorin).
  • Se corrige la deduplicación del streaming desde el motor S3(Azure)Queue. #95467 (Kseniia Sumarokova).
  • Se corrigió la actualización de las políticas de filas asignadas al usuario inicial en consultas distribuidas. #95469 (Vitaly Baranov).
  • Se corrige la comprobación de discos cifrados sobre plain_rewritable (corrige el posible It is not possible to register multiple plain-rewritable disks with the same object storage prefix). #95470 (Azat Khuzhin).
  • A la función de tabla mergeTreeProjection le faltaba una comprobación de acceso, lo que permitía a los usuarios sin permiso SELECT sobre una tabla (pero con permisos para funciones de tabla) leer datos de sus proyecciones. Esta corrección añade la misma comprobación de acceso que ya tienen mergeTreeIndex y mergeTreeAnalyzeIndexes. #95480 (Alexey Milovidov).
  • Corrige un posible error lógico al leer la subcolumna de tamaño de las subcolumnas dinámicas de los tipos Dynamic/JSON. #95573 (Pavel Kruglov).
  • Se corrige una regresión en la replicación sin copia (experimental) introducida por #94262, por la que las partes compartidas podían eliminarse antes de que otras réplicas terminaran de obtenerlas. #95597 (filimonov).
  • Se corrige un cierre inesperado al aplicar tupleElement a arrays de JSON. Cierra #95581. #95647 (Pavel Kruglov).
  • Se corrige la excepción por error lógico al usar un comodín (*) dentro de una función lambda en una cláusula VALUES de un JOIN con USING. Cierra #93675. #95661 (Vladimir Cherkasov).
  • Se corrigió el error lógico There was an error: Cannot obtain error message al esperar un DDL distribuido y eliminar simultáneamente la base de datos Replicated. Corrige el issue #95539. #95664 (Alexander Tokmakov).
  • Se corrige un problema en la función IN que devolvía resultados incorrectos con valores NULL cuando transform_null_in está habilitada. Cierra #65776. #95674 (Nihal Z. Miaji).
  • Maneja correctamente los tipos LowCardinality Nullable en CAST cuando la configuración cast_keep_nullable está habilitada. Cierra #95670. #95747 (Alexey Milovidov).
  • Corrige la compactación de datos particionados en Delta Lake. #95773 (Kseniia Sumarokova).
  • Se corrige una condición de carrera en la columna Nullable de join en los filtros en tiempo de ejecución. #95775 (Hechem Selmi).
  • Se corrige un posible error lógico en una consulta con comodines (*, table.*) y analyzer_compatibility_join_using_top_level_identifier cuando la columna USING tiene tipos distintos en las tablas y en la lista de selección. Cierra #90477. #95808 (Vladimir Cherkasov).
  • Se corrigieron errores de seguridad de memoria en operaciones del pool de hilos en paralelo (copias de seguridad, agregación, consultas distribuidas) que podían causar excepciones cuando se producía un error durante la programación de tareas. #95818 (Raúl Marín).
  • Corrige un fallo en DROP WORKLOAD cuando se ejecuta de forma concurrente con consultas que usan el workload que se está eliminando. #95856 (Alexey Milovidov).
  • Corrige la lentitud al consultar las tablas del sistema con un usuario que tiene privilegios limitados en muchas bases de datos. Cierra #89371. #95874 (pufit).
  • Se corrigió la ejecución de tupleElement en JSON con rutas anidadas; antes podía dar lugar a resultados de consulta incorrectos. #95907 (Pavel Kruglov).
  • Se corrigió un error NOT_SUPPORTED que podía producirse al usar el algoritmo de JOIN direct con una tabla MergeTree vacía. #95935 (Vladimir Cherkasov).
  • Corrige un problema por el que el client no sugería ni autocompletaba nombres de alias para configuraciones; cierra #92190. #95945 (phulv94).
  • Se ha corregido event_date en system.asynchronous_metric_log. #95947 (Raúl Marín).
  • Se corrige el manejo de las skipping paths en el tipo de datos JSON. Anteriormente, con JSON(SKIP path) se omitían todas las claves JSON con el prefijo path, incluso claves como "pathpath", por lo que esto podía provocar pérdida de datos en esas rutas durante el insert. Ahora ya está corregido y solo se omite la clave "path". #95948 (Pavel Kruglov).
  • Una parte con proyecciones desconocidas no debe marcarse como perdida definitivamente. #95952 (Mikhail Artemenko).
  • Corrige un problema por el que la cadena vacía pasaba a ser NULL en la tabla Join con clave Nullable(String). Cierra #71414. #96002 (Alexey Milovidov).
  • Ahora, el motor de PostgreSQL puede leer correctamente BOOLEAN[]. Cierra #72754. #96006 (Alexey Milovidov).
  • Corrige el formato ProtobufList en el caso de lectura desde un archivo vacío. Cierra #70059. #96007 (Alexey Milovidov).
  • Se corrige un problema en el formato ProtobufList, que generaba un registro fantasma en tablas vacías. Cierra #72596. #96010 (Alexey Milovidov).
  • Corrige la incompatibilidad de tipos en la función if entre UInt64 e Int32 en un caso inusual de consultas distribuidas y PREWHERE, con inferencia de tipos. Cierra #70017. #96012 (Alexey Milovidov).
  • Se corrigen las consultas compiladas con JIT que usan tipos Bool. #96013 (Alexey Milovidov).
  • Se corrige un error lógico al leer una columna UUID de una columna TEXT de SQLite. Cierra #71263. #96016 (Alexey Milovidov).
  • Corrige la conversión de tipos del motor SQLite para DateTime, Date, UUID y otros tipos. Cierra #73481. #96017 (Alexey Milovidov).
  • Los valores FixedString se escapaban incorrectamente en consultas a bases de datos externas como SQLite y PostgreSQL. Cierra #73519. En coautoría con @jh0x. #96019 (Alexey Milovidov).
  • Corrige un error de aserción en WindowTransform con un desplazamiento PRECEDING grande. Cierra #75852. #96026 (Alexey Milovidov).
  • Se corrige un error que podía provocar corrupción de datos cuando las inserciones asíncronas concurrentes usan los mismos nombres de parámetro, pero contienen valores diferentes. #96035 (Seva Potapov).
  • Se corrigió el período de los profilers globales (controlado por global_profiler_real_time_period_ns y global_profiler_cpu_time_period_ns). En lugar del valor configurado, se usaba un valor truncado, lo que hacía que el profiler se activara con más frecuencia de la prevista. #96048 (Antonio Andelic).
  • Antes, si en una entrada estaba presente el archivo de datos de referencia dentro del archivo de manifiesto de Iceberg para position delete, pero su valor era NULL, no obteníamos los límites correctos para los archivos de datos correspondientes. Este PR corrige este error. #96061 (Daniil Ivanik).
  • Se corrige la revocación de roles predeterminados. #96103 (Vitaly Baranov).
  • Se corrige un error de uso tras liberar memoria en el análisis de índices, en una combinación poco frecuente de use_primary_key deshabilitado y un número muy elevado de disyunciones de condiciones que utilizan el índice. #96112 (Alexey Milovidov).
  • Corrige una regresión del códec Gorilla cuando un tamaño especificado explícitamente no se corresponde con el tamaño del tipo de dato y el tamaño del búfer es demasiado pequeño. En versiones anteriores, se producía una excepción durante la descompresión. Cierra #78253. #96118 (Alexey Milovidov).
  • Evita un interbloqueo al cargar diccionarios cuando un diccionario hace referencia a una tabla Merge que, a su vez, lo referencia de forma recursiva. Cierra #78360. #96120 (Alexey Milovidov).
  • Corrección del uso de un valor no inicializado en formatDateTime con especificadores de formato de ancho no fijo, como los de estilo MySQL y JODA. #96133 (Alexey Milovidov).
  • La combinación de las opciones use_const_adaptive_granularity e index_granularity_bytes (que significa “granularidad no adaptativa”) provocó un cálculo erróneo del número de filas que se debían leer y una excepción. #96143 (Alexey Milovidov).
  • La ejecución de una mutación ALTER UPDATE no válida en tablas de almacenamiento de objetos de tipo archivo, como S3 y Azure, podía provocar una desreferenciación de nullptr. Cierra #92994. #96162 (Alexey Milovidov).
  • Se corrigió un problema por el que AccessRights::contains devolvía resultados incorrectos con revocaciones parciales. #96170 (pufit).
  • Se corrigió la colisión de hash en la caché de condiciones de consulta para constantes plegadas de CTE, lo que podía provocar un resultado de consulta incorrecto. Cierra #96060. #96172 (Alexey Milovidov).
  • Se corrige un posible interbloqueo en ProcessList. Puede ocurrir por una posible inversión en el orden de los bloqueos si el overcommit tracker de memoria se activa mientras añadimos una tarea al verificador de cancelación. #96182 (Antonio Andelic).
  • Se corrigió un error por el que las consultas con joins externos (LEFT, RIGHT o FULL) combinados con varios INNER JOINs podían devolver resultados incorrectos debido a una reordenación no válida de joins. Cuando la condición ON de un join externo hacía referencia a columnas de varias tablas unidas previamente, el optimizador no tenía en cuenta todas las dependencias entre tablas y podía reordenar los joins de forma incorrecta, lo que provocaba la ausencia de filas. Cierra #95972. #96193 (Vladimir Cherkasov).
  • Cuando una tabla no tiene estadísticas definidas, ClickHouse no debería intentar cargarlas. Esto evita cierta sobrecarga (más de 100 ms) al comprobar si existen los archivos de estadísticas. (issue #96068). #96233 (Han Fei).
  • Corrige optimize_syntax_fuse_functions para que no reescriba sum/count/avg como sumCount() cuando el argumento de agregación es LowCardinality(Nullable). Cierra #95390. #96239 (Nihal Z. Miaji).
  • Se corrige la poda incorrecta de particiones con not IN y not has en algunos casos. #96241 (Nihal Z. Miaji).
  • Se corrige stack-use-after-scope en el índice de similitud vectorial. #96259 (Alexey Milovidov).
  • Se corrige un problema por el que el ejecutor de pruebas no reconocía los comentarios de sugerencia de error cuando una consulta estaba precedida por un comentario SQL. #96336 (Yakov Olkhovskiy).
  • Se corrige un error lógico en KeyCondition cuando una tabla tiene una clave primaria Nullable y la consulta usa la función coalesce, cuyo primer argumento es constante. #96340 (Alexey Milovidov).
  • La interacción entre GROUPING SETS, group_by_use_nulls y el tipo de dato Tuple con LowCardinality en su interior podía producir una estructura de bloques inesperada en el pipeline de consulta, lo que provocaba un error lógico. Esto surgió tras la introducción de Tuples Nullable. #96358 (Alexey Milovidov).
  • Era posible crear una tabla con una expresión vacía () como índice, lo que provocaba un acceso no válido a la memoria. #96363 (Alexey Milovidov).
  • Se corrigió un fallo del analizador antiguo cuando había JOIN y alias duplicados. #96405 (Ilya Golshtein).
  • Se corrigió el error Nested columns sizes are inconsistent with local_discriminators debido a una optimización errónea del filtrado in-place para columnas Variant. #96410 (Alexey Milovidov).
  • Se corrige un problema por el que CREATE TABLE ... CLONE AS ... ignoraba el calificador completo de la tabla de origen. #96415 (Hasyimi Bahrudin).
  • Corrige la cancelación de la función de tabla mysql con KILL QUERY y al cancelar la consulta (Ctrl+C) en clickhouse-client. #96437 (Roman Vasin).
  • Corrige un bloqueo activo en el hilo de comprobación de cancelación de consultas con valores altos de max_execution_time. #96450 (Sergei Trifonov).
  • Se corrige un error lógico en algunos casos al utilizar valores fraccionarios de LIMIT/OFFSET en consultas distribuidas. #96475 (Nihal Z. Miaji).
  • Se corrige una desreferenciación de puntero nulo en ciertas expresiones con funciones lambda. #96479 (Alexey Milovidov).
  • Corrige resultados erróneos cuando las columnas LowCardinality se convierten en Nullable. #96483 (Nihal Z. Miaji).
  • Corrige un fallo al crear una tabla Iceberg con una cláusula ORDER BY que hace referencia a una columna inexistente o usa un argumento posicional. Cierra #93280. #96484 (Konstantin Vedernikov).
  • Se corrige la excepción del filtro en tiempo de ejecución para columnas Tuple con subcampos Nullable. #96509 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR en el lector nativo de Parquet V3 cuando la columna de filtro de PREWHERE contiene valores UInt8 no booleanos. #96594 (Alexey Milovidov).
  • Se corrige la regeneración implícita de índices en las tablas replicadas durante los cambios de metadatos. #96600 (Raúl Marín).
  • Corrige una condición de carrera en DROP WORKLOAD. #96614 (Sergei Trifonov).
  • Se corrige un error en las escrituras en tablas Iceberg por el que las inserciones en particiones podían provocar una distribución incorrecta de los datos entre los archivos de partición. #96620 (Konstantin Vedernikov).
  • Se corrigió heap-use-after-free en CREATE TABLE con restricciones. #96669 (Nikita Taranov).
  • Validar la versión witness en bech32 para evitar el desbordamiento de búfer. #96671 (Raúl Marín).
  • Se corrige un error por el que system.tables producía errores cuando se creaba un catálogo REST de lago de datos con una configuración auth_header no válida. #96680 (Han Fei).
  • Se corrigió min(timestamp), que devolvía epoch (1970-01-01) mediante _minmax_count_projection tras una fusión de TTL cuando se filtran todas las filas de un bloque. #96703 (Raquel Barbadillo).
  • Se mejora la validación de la configuración iceberg_metadata_file_path para evitar el path traversal y garantizar que el archivo de metadata especificado esté dentro del directorio de la tabla. #96754 (Daniil Ivanik).
  • Se corrige un fallo en ifNull con el argumento Variant utilizado en GROUP BY. #96790 (Alexey Milovidov).
  • Se corrigieron las colisiones de claves de caché entre tablas con la opción table_disk=1. #96818 (Raufs Dunamalijevs).
  • Se corrige que el hilo de purga de MemoryWorker se quedara bloqueado debido a una condición de carrera. #96819 (Antonio Andelic).
  • No registrar en los logs datos con credenciales en catálogos Iceberg. #96831 (Konstantin Vedernikov).
  • Se corrigió el código de salida de clickhouse-client tras un error del servidor. #96841 (Vitaly Baranov).
  • Las consultas con CROSS JOIN y réplicas paralelas habilitadas podían devolver resultados incorrectos. Soluciona #74337. #96848 (Igor Nikonov).
  • Se corrigió el error por el que fallaban las consultas ALTER TABLE DROP COLUMN tras haberse realizado previamente una actualización ligera en la misma columna. #96861 (Anton Popov).
  • Corregido el desbordamiento de pila (fallo) al crear copias de seguridad en formato de archivo (.zip, .tzst) en un disco plain_rewritable de almacenamiento de objetos. #96872 (Alexey Milovidov).
  • Se corrige el fallo del servidor cuando una copia de seguridad falla por falta de espacio en el disco u otros errores de E/S en el sistema de archivos de destino. #96873 (Alexey Milovidov).
  • Corrección de EXCEPT ALL y INTERSECT ALL, que no tenían en cuenta la multiplicidad de las filas y se comportaban como sus equivalentes DISTINCT. #96876 (Alexey Milovidov).
  • Se corrige la excepción std::terminate en indexOfAssumeSorted al llamarse con tipos incompatibles (p. ej., un array IPv4 con un valor de búsqueda entero). #96877 (Alexey Milovidov).
  • Se corrigió la excepción Bad cast from type DB::ColumnNullable to DB::ColumnString al usar funciones de ventana con group_by_use_nulls = 1 y CUBE/ROLLUP/GROUPING SETS. #96878 (Alexey Milovidov).
  • Corrige resultados incorrectos cuando las expresiones compiladas con JIT convierten DateTime a DateTime64 (p. ej., en CASE/if/multiIf con tipos DateTime mixtos). El valor se reinterpretaba en lugar de escalarse correctamente, lo que producía marcas de tiempo incorrectas una vez activada la compilación de expresiones. #96879 (Alexey Milovidov).
  • Se corrige la excepción por error lógico en CoalescingMergeTree cuando una expresión de índice de omisión produce una columna constante (p. ej., bloom_filter sobre ifNotFinite(1, c0) para una columna entera). #96880 (Alexey Milovidov).
  • Se corrige el número de puerto incorrecto en el mensaje de error al conectarse accidentalmente por HTTP al puerto del protocolo nativo con TLS habilitado. #96881 (Alexey Milovidov).
  • Corrección para que los SETTINGS por subconsulta se apliquen a las funciones de tabla como file en CTE y subconsultas. #96882 (Alexey Milovidov).
  • Se corrigió una fuga de memoria en objetos BIO al leer certificados X509. #96885 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR en el analizador de consultas cuando se pasa una expresión lambda donde se espera un valor concreto (p. ej., como argumento acumulador de arrayFold). #96892 (Alexey Milovidov).
  • Se corrige la excepción ColumnNullable is not compatible with original al convertir tipos anidados complejos (Array de Tuple Nullable que contiene Map con valores Enum Nullable). #96924 (Alexey Milovidov).
  • Se corrige una condición de carrera en la carga paralela del diccionario HASHED segmentado que, en ocasiones, podía hacer que algunas filas no se cargaran. #96953 (Alexey Milovidov).
  • Se corrigió una condición de carrera entre REPLACE PARTITION y las mutaciones en segundo plano que podía hacer que tanto los datos antiguos como los nuevos se vieran después del reemplazo. #96955 (Alexey Milovidov).
  • Se corrigió un problema en la función arrayJoin que producía filas duplicadas cuando se usaba con INNER JOIN y la cláusula WHERE, debido a que la optimización parcial de push-down de predicados enviaba incorrectamente por debajo de un JOIN los filtros que contenían arrayJoin. #96989 (Alexey Milovidov).
  • Corrige un fallo (SEGFAULT) en clearCaches causado por que BlockIO::operator= no movía query_metadata_cache, lo que provocaba la destrucción prematura de instantáneas de almacenamiento en caché y un acceso a memoria ya liberada en el almacenamiento MergeTreeData. #96995 (Alexey Milovidov).
  • Se corrige un fallo de aserción en IfTransformStringsToEnumPass cuando la función if o transform devuelve Nullable(String) (p. ej., con GROUP BY ... WITH CUBE y group_by_use_nulls = true). #97002 (Alexey Milovidov).
  • Se corrigen los datos incorrectos escritos durante INSERT ... SELECT con UNION ALL y JOIN, donde las columnas de texto constantes podían recibir valores erróneos tras la compactación de bloques. #97019 (Hasyimi Bahrudin).
  • Se corrige la excepción de assert_cast (o la corrupción silenciosa de datos en compilaciones release) al generar estadísticas de columnas después de que ALTER TABLE MODIFY COLUMN cambie el tipo de la columna. #97027 (Alexey Milovidov).
  • Se corrigen lecturas de memoria sin inicializar en Azure Blob Storage, el protocolo SSH y las interfaces de Arrow Flight. #97053 (Alexey Milovidov).
  • Se corrigen los casos en los que los índices afectaban al resultado de las consultas con row policy/PREWHERE y FINAL. #97076 (Yarik Briukhovetskyi).
  • Corrige la condición de carrera restante entre REPLACE PARTITION y las mutaciones en segundo plano en tablas MergeTree, que podía provocar la reaparición de datos antiguos. #97105 (Alexey Milovidov).
  • Corregir los índices implícitos con columnas con alias y realizar una validación completa antes de crearlos. #97115 (Raúl Marín).
  • Se corrige un error lógico en FunctionVariantAdaptor con funciones que requieren argumentos const, como arrayROCAUC. #97116 (Bharat Nallan).
  • Corregir las mutaciones atascadas cuando PartCheckThread vuelve a encolar un GET_PART para una parte ya mutada, lo que deja entradas fantasma en parts_to_do. #97162 (Alexey Milovidov).
  • Se corrige la estimación del número de filas del plan de consulta para subconsultas con ORDER BY ... LIMIT, que podía hacer que el optimizador eligiera un orden de join subóptimo. #97193 (Alexander Gololobov).
  • Se corrige la excepción LOGICAL_ERROR en FunctionVariantAdaptor cuando una función que opera sobre columnas Variant devuelve el tipo Nothing, lo que puede ocurrir con Arrays vacíos en consultas UNION ALL. #97213 (Alexey Milovidov).
  • Se corrige una condición de carrera durante las operaciones de copia multiparte en S3 (por ejemplo, durante BACKUP/RESTORE en S3) que podía provocar excepciones en caso de acceso concurrente. #97227 (Azat Khuzhin).
  • Se corrige la excepción LOGICAL_ERROR cuando arrayJoin en la cláusula WHERE hace referencia a columnas de ambos lados de un JOIN. #97239 (Alexey Milovidov).
  • Se corrigió la excepción LOGICAL_ERROR al leer la subcolumna .size de un Nullable(String) disperso en una Tuple con PREWHERE. #97264 (Alexey Milovidov).
  • Se corrige la excepción “El número de filas en el fragmento diferido no coincide con el número de desplazamientos” en LazyMaterializingTransform al leer tablas con granularidad de índice no adaptativa (index_granularity_bytes = 0) usando ORDER BY ... LIMIT. #97270 (Alexey Milovidov).
  • Corrige que SYSTEM RESTART REPLICA pierda una tabla de la base de datos cuando falla la recreación de la tabla con una excepción no relacionada con ZooKeeper (p. ej., límite de memoria), lo que provoca desajustes en el hash de metadatos en DatabaseReplicated. #97276 (Alexey Milovidov).
  • El campo readonly de system.merge_tree_settings ahora refleja correctamente que ciertas configuraciones de MergeTree (por ejemplo, index_granularity) son incondicionalmente de solo lectura. #97277 (Robert Schulze).
  • Se corrigió un cierre inesperado durante la optimización de count() en tablas MergeTree cuando el snapshot de almacenamiento se creó sin datos. #97281 (Pablo Marcos).
  • Corrige un posible fallo al resolver los nombres de las funciones a partir de la información de depuración de las trazas de pila. #97294 (Azat Khuzhin).
  • Soluciona un error lógico con analyzer_compatibility_join_using_top_level_identifier y las columnas ALIAS. Cierra #96228. #97297 (Vladimir Cherkasov).
  • Se corrigió la excepción LOGICAL_ERROR en applyOrder al usar columnas con índice de texto con la cláusula QUALIFY. #97313 (Alexey Milovidov).
  • La tabla del sistema system.functions ahora muestra categories = 'Internal' para las funciones internas, en lugar de categories = ''. #97315 (Robert Schulze).
  • La consulta con una secuencia de RIGHT JOIN y réplicas paralelas habilitadas puede producir un resultado incorrecto. Corrige #74341. #97316 (Igor Nikonov).
  • Se corrigen errores TABLE_UUID_MISMATCH espurios que podían producirse con vistas materializadas actualizables y en otros casos en los que se cambia el nombre de las tablas. #97323 (Azat Khuzhin).
  • Se corrige un segfault en la copia de seguridad de StorageKeeperMap debido al uso de un puntero de almacenamiento colgante tras liberarlo en el lote de copia de seguridad diferido. #97336 (Alexey Milovidov).
  • Se corrige la función exists con una subconsulta escalar dentro de un ALTER UPDATE/DELETE cuando mutations_execute_subqueries_on_initiator está habilitado. La subconsulta escalar se evaluaba de forma incorrecta, lo que podía provocar un error o un comando de mutación corrupto que hiciera que la tabla no pudiera cargarse en el siguiente reinicio del servidor. #97347 (Kirill Kopnev).
  • Se corrige la excepción lógica Unexpected return type from equals. Expected Nullable(UInt8). Got Const(LowCardinality(Nullable(UInt8))) al comparar NULL con una columna Variant que contiene tipos de LowCardinality. #97379 (Alexey Milovidov).
  • Se corrige una posible condición de carrera cuando EXCHANGE TABLES se ejecuta en paralelo con la caché de consultas por segmentos habilitada. #97411 (Konstantin Vedernikov).
  • Corrige la excepción LOGICAL_ERROR en la conversión de Array a QBit cuando nullable_source de un envoltorio Tuple externo reemplaza la columna de array convertida por una columna de tipo incompatible. Cierra #97389. #97413 (Alexey Milovidov).
  • Corrige una inconsistencia en el formateo del AST al reconstruir literales de tupla con alias entre paréntesis; por ejemplo, (('a', 'b') AS x) se reformateaba incorrectamente como tuple(('a', 'b') AS x). #97418 (Alexey Milovidov).
  • Corrige una excepción durante las inserciones asíncronas con deduplicación cuando un error de análisis producía un bloque vacío con cero filas. #97460 (Sema Checherinda).
  • Se corrige la excepción “El número de filas en el fragmento diferido no coincide con el número de desplazamientos” en LazyMaterializingTransform al leer tablas con granularidad de índice no adaptativa (index_granularity_bytes = 0) mediante ORDER BY ... LIMIT. #97482 (Alexey Milovidov).
  • Corrige la configuración de inserción en Iceberg. Añade un alias para la opción allow_experimental_insert_into_iceberg. #97483 (Konstantin Vedernikov).
  • Se corrige ACCESS_DENIED para los usuarios sin el permiso CREATE TEMPORARY TABLE cuando la optimización optimize_inverse_dictionary_lookup reescribe los predicados dictGet(...). ClickHouse ahora omite esa reescritura y ejecuta la expresión original. Cierra #97269. #97484 (Nihal Z. Miaji).
  • Corrige un error de aserción (excepción en compilaciones de depuración o con sanitizador) en Set y MergeTreeIndexSet al procesar columnas con subcolumnas dispersas internas (p. ej., columnas Tuple de partes de MergeTree con distintos perfiles de serialización dispersa). #97493 (Alexey Milovidov).
  • Corrige un posible uso de memoria después de liberarla en StorageKafka2. #97520 (Bharat Nallan).
  • Se corrige el uso de INTO OUTFILE con TRUNCATE y la opción into_outfile_create_parent_directories cuando la ruta de salida contiene directorios. #97549 (Alexey Milovidov).
  • Se corrigió el error BAD_ARGUMENTS al consultar tablas con expresiones lambda dentro de columnas ALIAS mediante la table function merge() con el analizador habilitado. #97551 (Alexey Milovidov).
  • Se corrige la excepción de system.zookeeper_info cuando el zxid de Keeper es 0. #97553 (Alexey Milovidov).
  • Corrige un posible error lógico en el diccionario ip_trie cuando el tipo de clave no es String. #97555 (Bharat Nallan).
  • Se corrigió un problema por el que la autenticación OAuth del catálogo REST no funcionaba para el RestCatalog base (solo funcionaba para catálogos derivados como OneLakeCatalog). Esto rompió el catálogo REST predeterminado tras la introducción del catálogo BigLake. #97561 (Konstantin Vedernikov).
  • Las funciones de Geometry (perimeterSpherical, areaSpherical, etc.) ahora aceptan subtipos geométricos individuales (Polygon, Ring, Point, etc.), además del tipo Variant Geometry. #97571 (Alexey Milovidov).
  • Se corrige la excepción LOGICAL_ERROR al usar isNull/isNotNull sobre subcolumnas de tipos Nullable(Tuple(... Nullable(T) ...)). Cierra #97224. #97582 (Alexey Milovidov).
  • Corrige la desreferenciación de un puntero nulo al aplicar partes de parche durante las actualizaciones ligeras. #97583 (Alexey Milovidov).
  • BaseSettings::readBinary pasa el índice de accessor.find a field_infos[] sin comprobar el valor centinela que indica que no se encontró (es decir, -1), lo que puede provocar un acceso fuera de los límites de std::vector. El problema se detectó gracias al endurecimiento de libcxx. Esto probablemente ocurrió durante la deserialización del plan de consulta, cuando un servidor más reciente envía un ajuste que un servidor más antiguo no reconoce. El método de lectura basado en cadenas ya gestiona esto correctamente; a readBinary le faltaba esa misma comprobación. #97585 (Miсhael Stetsyuk).
  • Corrige resultados incorrectos en consultas UNION ALL en las que una rama tenía un predicado siempre falso: la rama leía datos indebidamente en lugar de no devolver nada. #97620 (Bharat Nallan).
  • Se corrigió el fallo de IN (col) con una referencia de una sola columna que provocaba el error UNSUPPORTED_METHOD. #97646 (Alexey Milovidov).
  • Se corrigió la excepción por error lógico durante GROUP BY ... WITH ROLLUP/CUBE cuando las claves incluyen LowCardinality(Nullable(...)) dentro de Nullable(Tuple(...)). #97647 (Alexey Milovidov).
  • Se corrigió una inconsistencia en el formato del AST para NOT (1, 1, 1) que podía provocar LOGICAL_ERROR en builds de depuración. #97653 (Alexey Milovidov).
  • Corrige la excepción de keeper-converter al encontrarse con archivos de registro de transacciones de ZooKeeper vacíos. #97673 (Alexey Milovidov).

Mejora en compilación/pruebas/empaquetado

  • ClickHouse puede compilarse con clang-23 (master). #95578 (Alexey Milovidov).
  • Se corrige is_local para forzarlo a false cuando bind_host está configurado, y se sustituye por una prueba de integración. Seguimiento de #74741. #93109 #96018 (Zhigao Hong).
  • Pruebas de estrés: se corrigen las pruebas de estrés y de actualización en CI. se ignoran las etiquetas no-{build}. se añade aleatorización de compatibilidad. #94693 (Nikita Fomichev).
  • Publicar el binario parser_memory_profiler de la compilación. La herramienta puede usarse para analizar el consumo de memoria del AST. #95826 (Ilya Yatsishin).
  • Se agregó la marca --symbolize para la herramienta parser_memory_profiler, que genera archivos .heap.sym con los símbolos resueltos en la salida. #96477 (Ilya Yatsishin).
  • Se fijan las imágenes de Docker de terceros en versiones específicas para las pruebas de integración. #96500 (Alexey Milovidov).
  • Se vuelve a habilitar la posibilidad de enlazar OpenSSL dinámicamente. No se recomienda y no se utiliza en ninguna compilación de producción, pero la opción sigue existiendo para los entusiastas de internet. #96506 (Govind R Nair).
  • Reduce el rango de magic_enum de [-100, 1000] al valor predeterminado [-128, 127] mediante una especialización por tipo para Coordination::OpNum, lo que mejora el tiempo de compilación. #96632 (Alexey Milovidov).
  • Se eliminaron los templates de C++ innecesarios de las clases Function para reducir los tiempos de compilación. #96646 (Alexey Milovidov).
  • Se traslada la generación de StorageSystemLicenses a la fase de configuración para mejorar el paralelismo de la compilación. #96697 (Alexey Milovidov).
  • Se paraleliza el escaneo de licencias. #96727 (Raúl Marín).
  • Añadida una prueba funcional sin estado para el soporte del protocolo SSH. #96996 (Alexey Milovidov).
  • Se añadió Kafka 3.9.0 a la infraestructura de pruebas funcionales sin estado, lo que permite probar directamente los motores de tabla Kafka y Kafka2 usando ClickHouse Keeper como ZooKeeper. Seis nuevas pruebas sin estado cubren las operaciones básicas de producción y consumo, las columnas virtuales, INSERT, varios formatos, la gestión de mensajes corruptos y el almacenamiento de offsets basado en Keeper. #96997 (Alexey Milovidov).
  • Se añade un flujo de trabajo de CI para compilar una toolchain de clang optimizada con PGO+BOLT. #96991 (Alexey Milovidov).
  • Usar la compilación de LLVM/Clang optimizada con PGO en CI, lo que debería mejorar la velocidad de compilación entre un 20 y un 30 %. #97031 (Alexey Milovidov).
  • Se reemplazan las funciones matemáticas de glibc por implementaciones de llvm-libc. #90151 (Konstantin Bogdanov).
  • Se actualiza Boost de 1.83 a 1.90 y se corrige un fallo de aserción de devector en compilaciones de depuración. #97037 (Alexey Milovidov).
  • Se actualizó postgres a REL_18_1. #95189 (Konstantin Bogdanov).
  • Se usa libexpat 2.7.3. #95218 (Konstantin Bogdanov).
  • Usar OpenSSL 3.5.5. #95345 (Konstantin Bogdanov).
  • Se usa simdjson v4.2.4. #97129 (Konstantin Bogdanov).
  • Se usa libarchive 3.8.5. #97131 (Konstantin Bogdanov).
  • Se usa fast_float v8.2.3. #97133 (Konstantin Bogdanov).
  • Usar abseil-cpp 20260107.1 y actualizar s2geometry a la versión v0.13.1. #97134 (Konstantin Bogdanov).
  • Aumenta libxml2 a 2.15.1. #95574 (Robert Schulze).
  • Se actualizaron 7 imágenes de Docker para pruebas de integración de Tier-3, sustituyendo imágenes base obsoletas (EOL) o retiradas por versiones compatibles actuales. #97314 (Rahul).
  • Se añaden consultas del benchmark TPC-DS. #97349 (Raufs Dunamalijevs).
  • Sustituye las opciones individuales de CMake para el conjunto de instrucciones x86 (ENABLE_SSSE3, ENABLE_AVX2, NO_SSE3_OR_HIGHER, ARCH_NATIVE, etc.) por una única opción numérica X86_ARCH_LEVEL (1/2/3/4), en línea con los niveles estándar de microarquitectura x86-64 ya utilizados por el sistema de despacho en runtime. #97354 (Raúl Marín).
  • Se evita instanciar variantes de plantilla de division_by_nullable=true para operaciones que no son de división en FunctionBinaryArithmetic, lo que reduce el tiempo de compilación y el tamaño del binario. #97496 (Raúl Marín).
  • Reduce la huella de inclusión de Exception.h eliminándolo de archivos de cabecera muy referenciados, como typeid_cast.h, assert_cast.h, Context_fwd.h, IDataType.h y varios archivos de cabecera de Column. #97497 (Raúl Marín).
  • Use siempre las cabeceras integradas de compiler-rt (sanitizador y las interfaces de XRay) en lugar de las cabeceras del compilador del sistema, y compile de forma predeterminada las bibliotecas compiler-rt a partir del código fuente. #97499 (Raúl Marín).
  • Se evita incluir las cabeceras de boost/multiprecision en wide_integer_impl.h en plataformas con un long double adecuado, lo que mejora el tiempo de compilación. #96633 (Alexey Milovidov).
  • Implementar el job de cobertura de código con LLVM y habilitarlo inicialmente para la rama master. #90952 (Alexey Bakharew).
  • Se habilita el hardening rápido de libcxx para las compilaciones de release. Esto es necesario principalmente para las comprobaciones de acceso fuera de límites. Dados los resultados de las pruebas de rendimiento, no se espera ningún impacto perceptible en el rendimiento. #94757 (Miсhael Stetsyuk).

Lanzamiento de ClickHouse 26.1, 2026-01-29. Presentación, Vídeo

Cambio incompatible con versiones anteriores

  • Corrige el formato inconsistente causado por una sustitución incorrecta de alias en el formateador. Esto cierra #82833. Esto cierra #82832. Esto cierra #68296. Este cambio podría no ser compatible con versiones anteriores: cuando el analizador está deshabilitado, ciertas consultas CREATE VIEW con IN que hacen referencia a un alias no pueden procesarse. Para evitar esta incompatibilidad, habilite el analizador (está habilitado de forma predeterminada desde la versión 24.3). #82838 (Alexey Milovidov).
  • Los códecs DEFLATE_QPL y ZSTD_QAT se eliminaron. Se recomienda a los usuarios convertir los datos existentes comprimidos con DEFLATE_QPL o ZSTD_QAT a otro códec antes de actualizar. Tenga en cuenta que, para usar estos códecs, era necesario habilitar los ajustes enable_deflate_qpl_codec y enable_zstd_qat_codec. #92150 (Robert Schulze).
  • Mejora la depuración de UDF al habilitar la captura de stderr en system.query_log.exception. Anteriormente, el stderr de las UDF solo se registraba en archivos y no se exponía en los registros de consultas, lo que hacía imposible la depuración. Ahora, stderr genera excepciones de forma predeterminada y se acumula por completo (hasta 1 MB) antes de lanzarse, por lo que las trazas completas de Python y los mensajes de error aparecen en system.query_log.exception, lo que facilita una solución eficaz de problemas. #92209 (Xu Jia).
  • La lista vacía de columnas en la cláusula JOIN USING () ahora se considera un error de sintaxis. Anteriormente, debía producir INVALID_JOIN_ON_EXPRESSION durante la ejecución de la consulta. En algunos casos, como al realizar un join con el motor de almacenamiento Join, esto provocaba LOGICAL_ERROR; cierra el issue #82502. #92371 (Vladimir Cherkasov).
  • Utiliza la coincidencia parcial para SKIP REGEXP en el tipo JSON de forma predeterminada. Cierra #79250. #92847 (Pavel Kruglov).
  • Se revierte “Allow INSERT into simple ALIAS columns” (revierte ClickHouse/ClickHouse#84154). No funciona con formatos personalizados y no está protegido por ninguna configuración. #92849 (Azat Khuzhin).
  • Configuración para devolver un error si un catálogo de lago de datos no tiene acceso al almacenamiento de objetos. #93606 (Konstantin Vedernikov).
  • Se ha eliminado el motor de base de datos Lazy y ya no está disponible. Cierra #91231. #93627 (Alexey Milovidov).
  • Se elimina el modo transposed_with_wide_view de metric_log, ya que no se puede usar debido a un error. Ya no es posible definir system.metric_log con este modo. Esto revierte parcialmente #78412. #93867 (Alexey Milovidov).
  • La planificación de CPU para las cargas de trabajo ahora es preventiva de forma predeterminada. Consulte la configuración del servidor cpu_slot_preemption. #94060 (Sergei Trifonov).
  • Se escapan los nombres de archivo de los índices para evitar partes dañadas. Con este cambio, ClickHouse no podrá cargar índices con caracteres no ASCII en su nombre creados por versiones anteriores. Para resolverlo, puede usar la configuración de MergeTree escape_index_filenames. #94079 (Raúl Marín).
  • Las configuraciones de formato exact_rows_before_limit, rows_before_aggregation, cross_to_inner_join_rewrite, regexp_dict_allow_hyperscan, regexp_dict_flag_case_insensitive, regexp_dict_flag_dotall y dictionary_use_async_executor pasaron a ser configuraciones normales (no de formato). Se trata de un cambio puramente interno, sin efectos visibles para el usuario, salvo en el caso (poco probable) de que haya especificado alguna de estas configuraciones en definiciones de table engine de Iceberg o DeltaLake o Kafka o S3 o S3Queue o Azure o Hive o RabbitMQ o Set o FileLog o NATS. En esos casos, estas configuraciones antes se ignoraban; ahora, esas definiciones generan un error. #94106 (Robert Schulze).
  • Las funciones joinGet/joinGetOrNull ahora exigen privilegios SELECT sobre la tabla Join subyacente. Después de este cambio, ejecutar joinGet('db.table', 'column', key) requiere que el usuario tenga el privilegio SELECT tanto sobre las columnas clave definidas en la tabla Join como sobre la columna de atributo recuperada. Las consultas que no cuenten con estos privilegios fallarán con ACCESS_DENIED. Para migrar, otorgue los permisos necesarios mediante GRANT SELECT ON db.join_table TO user para acceso completo a la tabla, o GRANT SELECT(key_col, attr_col) ON db.join_table TO user para acceso a nivel de columna. Este cambio afecta a todos los usuarios y aplicaciones que dependen de joinGet/joinGetOrNull en los casos en que antes no se hubieran configurado privilegios SELECT explícitos. #94307 (Vladimir Cherkasov).
  • Se comprueba SHOW COLUMNS para las consultas CREATE TABLE ... AS .... Anteriormente, se comprobaba SHOW TABLES, lo que supone un privilegio incorrecto para este tipo de comprobación de permisos. #94556 (pufit).
  • Hacer que el formato de salida Hash sea independiente del tamaño de los bloques. #94503 (Alexey Milovidov). Tenga en cuenta que esto cambia los valores hash de salida con respecto a las versiones anteriores.

Nueva funcionalidad

  • API HTTP y Web UI integrada para ClickHouse Keeper. #78181 (pufit y speeedmaster).
  • La deduplicación de async insert ahora funciona con vistas materializadas dependientes. Cuando se produce una colisión por block_id, el bloque original se filtra para eliminar las filas asociadas a ese block_id, y las filas restantes se transforman con todas las consultas SELECT de las vistas materializadas pertinentes; esto reconstruye el bloque original sin las filas en conflicto. #89140 (Sema Checherinda). Se permite usar deduplicación con async inserts cuando intervienen vistas materializadas. #93957 (Sema Checherinda).
  • Se introdujeron una nueva sintaxis y un nuevo framework para simplificar y ampliar la funcionalidad de los índices de proyección. Esto da continuidad a https://github.com/ClickHouse/ClickHouse/pull/81021. #91844 (Amos Bird).
  • Se añade soporte para índices de texto en columnas Array. #89895 (Jimmy Aguilar Mena).
  • Se habilita use_variant_as_common_type de forma predeterminada, lo que permite usar tipos incompatibles dentro de un Array, en consultas UNION y en las ramas de if/multiIf/case. #90677 (Alexey Milovidov).
  • Nueva tabla del sistema zookeeper_info. Implementa #88014. #90809 (Smita Kulkarni).
  • Se admite el tipo Variant en todas las funciones. #90900 (Bharat Nallan).
  • Agrega una métrica ClickHouse_Info al endpoint /metrics de Prometheus que contiene principalmente información sobre la versión, lo que permite crear gráficos para seguir información detallada de la versión a lo largo del tiempo. #91125 (Christoph Wurm).
  • Se introduce un nuevo comando rcfg de cuatro letras para Keeper que permite cambiar la configuración del clúster. Este comando ofrece más posibilidades para modificar la configuración que la solicitud estándar reconfigure. El comando recibe una cadena json como argumento. El conjunto completo de bytes enviados a la interfaz TCP debe tener este aspecto: rcfg{json_string_length_big_endian}{json_string}. Algunos ejemplos del comando podrían ser así: {"preconditions": {"leaders": [1, 2], "members": [1, 2, 3, 4, 5]}, "actions": [{"transfer_leadership": [3]}, {"remove_members": [1, 2]}, {"set_priority": [{"id": 4, "priority": 100}, {"id": 5, "priority": 100}]}, {"transfer_leadership": [4, 5]}, {"set_priority": [{"id": 3, "priority": 0}]}]}. #91354 (alesapin).
  • Se agrega la función reverseBySeparator, que invierte el orden de las subcadenas de una cadena delimitadas por un separador especificado. Cierra #91463. #91780 (Xuewei Wang).
  • Añade la nueva configuración max_insert_block_size_bytes, que permite un control más preciso de la formación de los bloques insertados. #92833 (Kirill Kopnev).
  • Es posible ejecutar consultas DDL con la cláusula ON CLUSTER en una base de datos Replicated si está habilitada la configuración ignore_on_cluster_for_replicated_database. En este caso, se ignorará el nombre del clúster. #92872 (Kirill).
  • Se implementó la función mergeTreeAnalyzeIndexes. #92954 (Azat Khuzhin).
  • Se agregó la nueva configuración use_primary_key. Establézcala en false para desactivar la poda de gránulos según la clave primaria. #93319 (Nihal Z. Miaji).
  • Se añadió la función de tabla icebergLocalCluster. #93323 (Anton Ivashkin).
  • Se añadió la función cosineDistanceTransposed, que aproxima la distancia de coseno entre dos puntos. #93621 (Raufs Dunamalijevs).
  • Se añade la columna files a la tabla system.parts, que muestra el número de archivos en cada parte de datos. #94337 (Match).
  • Añade un scheduler max-min fair para el control de la concurrencia. Proporciona una mayor equidad en situaciones de sobreasignación elevada, cuando muchas consultas compiten por slots de CPU limitados. Las consultas de corta duración no se ven penalizadas por las de larga duración, que han acumulado más slots con el tiempo. Se habilita con el valor max_min_fair de la configuración de servidor concurrent_threads_scheduler. #94732 (Sergei Trifonov).
  • Se añadió la posibilidad de que ClickHouse client sobrescriba el SNI de TLS al conectarse al servidor. #89761 (Matt Klein).
  • Admite tablas temporales en las llamadas a la función joinGet. #92973 (Eduard Karacharov).
  • Admite vectores de eliminación en el motor de tabla DeltaLake. #93852 (Kseniia Sumarokova).
  • Se admiten vectores de eliminación en deltaLakeCluster. #94365 (Kseniia Sumarokova).
  • Compatibilidad con Google Cloud Storage para lagos de datos. #93866 (Konstantin Vedernikov).

Funcionalidad experimental

Mejora del rendimiento

  • La configuración use_skip_indexes_on_data_read ahora está habilitada de forma predeterminada. Esta configuración permite filtrar de forma continua al mismo tiempo que se leen los datos, lo que mejora el rendimiento de las consultas y el tiempo de arranque. #93407 (Shankar Iyer).
  • Mejora el rendimiento de DISTINCT en las columnas LowCardinality. Cierra #5917. #91639 (Nihal Z. Miaji).
  • Optimizar la función de agregación distinctJSONPaths para que lea únicamente las rutas JSON de las partes de datos, en lugar de toda la columna JSON. #92196 (Pavel Kruglov).
  • Más filtros aplicados con pushdown en JOINs. #85556 (Nikita Taranov).
  • Se amplía la compatibilidad con más casos de push down desde la condición ON del join cuando el filtro usa entradas de un solo lado. Se admiten joins ANY, SEMI y ANTI. #92584 (Dmitry Novik).
  • Permite usar conjuntos equivalentes para hacer push down de filtros en SEMI JOIN. Cierra #85239. #92837 (Dmitry Novik).
  • Omitir la lectura del lado izquierdo del hash join cuando el lado derecho está vacío. Antes leíamos el lado izquierdo hasta el primer bloque no vacío, lo que podía implicar mucho trabajo en casos con mucho filtrado o agregación. #94062 (Alexander Gololobov).
  • Uso del método “fastrange” (Daniel Lemire) para particionar datos dentro de la canalización de consultas. Esto podría mejorar la ordenación paralela y los JOINs. #93080 (Alexey Milovidov).
  • Mejora el rendimiento de las funciones de ventana cuando PARTITION BY coincide con la clave de ordenación o es un prefijo de ella. #87299 (Nikita Taranov).
  • Se hace pushdown del filtro externo en las vistas, lo que permite aplicar PREWHERE en nodos locales y remotos. Resuelve #88189. #88316 (Igor Nikonov).
  • Se implementan compilaciones JIT para más funciones. Cierra #73509. #88770 (Alexey Milovidov con Taiyang Li).
  • Si un índice de salto utilizado en una consulta FINAL está en una columna que forma parte de la clave primaria, el paso adicional para comprobar la intersección con la clave primaria en otras partes es innecesario y ya no se realiza. Resuelve #85897. #93899 (Shankar Iyer).
  • Optimiza el rendimiento y el uso de memoria de LIMIT y OFFSET fraccionarios. #91167 (Ahmed Gouda).
  • Se corrige el uso de una lógica de lectura aleatoria más rápida en el prefetcher de Parquet Reader V3. Cierra #90890. #91435 (Arsen Muk).
  • Mejora el rendimiento de icebergCluster. Cierra #91462. #91537 (Yang Jiang).
  • No filtrar por columnas virtuales con filtros constantes. #91588 (c-end).
  • Reduce el uso de memoria de INSERT/merges con wide parts en tablas muy anchas al habilitar búferes de escritura adaptativos. Añade compatibilidad con búferes de escritura adaptativos para discos cifrados. #92250 (Azat Khuzhin).
  • Se mejoró el rendimiento de la búsqueda de texto completo con índice de texto y el tokenizador sparseGrams al reducir el número de tokens buscados en el índice. #93078 (Anton Popov).
  • La función isValidASCII se optimizó para casos positivos, es decir, valores de entrada compuestos únicamente por caracteres ASCII. #93347 (Robert Schulze).
  • La optimización de lectura en orden ahora detecta cuándo las columnas de ORDER BY son constantes debido a las condiciones de WHERE, lo que permite realizar lecturas eficientes en orden inverso. Esto beneficia a consultas multi-tenant como WHERE tenant='42' ORDER BY tenant, event_time DESC, que ahora pueden usar InReverseOrder en lugar de requerir una ordenación completa.”. #94103 (matanper).
  • Se introduce una clase especializada del AST de enum para almacenar parámetros de valor como pares (cadena, entero) en lugar de nodos ASTLiteral, con el fin de optimizar el consumo de memoria. #94178 (Ilya Yatsishin).
  • Análisis distribuido de índices en varias réplicas. Resulta beneficioso para el almacenamiento compartido y para grandes volúmenes de datos en un clúster. Esto se aplica a SharedMergeTree (ClickHouse Cloud) y podría aplicarse a otros tipos de tablas MergeTree sobre almacenamiento compartido. #86786 (Azat Khuzhin).
  • Reducir la sobrecarga de los filtros de runtime de join deshabilitándolos en los siguientes casos: - hay demasiados bits activados en el filtro bloom - se filtran muy pocas filas en runtime. #91578 (Alexander Gololobov).
  • Se usa un búfer en memoria para la entrada de subconsultas correlacionadas para evitar evaluarla varias veces. Parte de #79890. #91205 (Dmitry Novik).
  • Permite que todas las réplicas tomen rangos huérfanos durante la lectura con réplicas en paralelo. Esto mejora el equilibrio de carga y reduce la latencia en la cola larga. #91374 (zoomxi).
  • Las operaciones externas de agregación, ordenación y join ahora respetan la configuración de consulta temporary_files_codec en todos los contextos. Se corrigieron los eventos de perfil ausentes para grace hash join. #92388 (Vladimir Cherkasov).
  • Mejorar la robustez de la detección del uso de memoria de las consultas para el volcado a disco durante la agregación/ordenación. #92500 (Azat Khuzhin).
  • Estimar el recuento total de filas y las estadísticas de NDV (número de valores distintos) de las columnas de la clave de agregación. #92812 (Alexander Gololobov).
  • Optimiza la compresión de las listas de postings con simdcomp. #92871 (Peng Jian).
  • Se refactorizó el procesamiento del modo Ordered de S3Queue con buckets. Esto también debería mejorar el rendimiento al reducir el número de solicitudes a Keeper. #92889 (Kseniia Sumarokova).
  • Las funciones mapContainsKeyLike y mapContainsValueLike ahora pueden usar un índice de texto en mapKeys() o mapValues(), respectivamente. #93049 (Michael Jarrett).
  • Reduce el uso de memoria en sistemas no Linux (habilita la purga inmediata de las páginas sucias de jemalloc). #93360 (Eduard Karacharov).
  • Forzar el purgado de las arenas de jemalloc en caso de que la proporción entre el tamaño de las páginas sucias y max_server_memory_usage supere memory_worker_purge_dirty_pages_threshold_ratio. #93500 (Eduard Karacharov).
  • Reduce el uso de memoria para AST. #93601 (Nikolai Kochetov).
  • En algunos casos, hemos visto que ClickHouse no respeta el límite de memoria al leer desde una tabla. Se ha corregido este comportamiento. #93715 (Nikita Mikhaylov).
  • Se habilitan de forma predeterminada las extensiones CHECK_STAT y TRY_REMOVE de Keeper. #93886 (Mikhail Artemenko).
  • Analizar los límites inferior y superior de los nombres de archivo correspondientes a los borrados posicionales en las entradas del archivo de manifiesto de Iceberg para seleccionar mejor los archivos de datos correspondientes. #93980 (Daniil Ivanik).
  • Agrega dos ajustes más para controlar el número máximo de subcolumnas dinámicas en una columna JSON. El primero es el ajuste de MergeTree merge_max_dynamic_subcolumns_in_compact_part (similar al ya añadido merge_max_dynamic_subcolumns_in_wide_part) que limita el número de subcolumnas dinámicas creadas durante la fusión en una parte Compact. El segundo es el ajuste a nivel de consulta max_dynamic_subcolumns_in_json_type_parsing, que limita el número de subcolumnas dinámicas creadas durante el análisis de datos JSON; permitirá especificar el límite en la inserción. #94184 (Pavel Kruglov).
  • Se optimiza ligeramente la compactación de columnas de tipo JSON en algunos casos. #94247 (Pavel Kruglov).
  • Reduzca el tamaño de las colas del pool de hilos en función de la experiencia en producción. Añada una comprobación explícita del consumo de memoria antes de leer cualquier dato de MergeTree. #94692 (Nikita Mikhaylov).
  • Asegúrese de que el planificador dé prioridad al hilo MemoryWorker cuando haya escasez de CPU, ya que protege el proceso de ClickHouse frente a una amenaza existencial. #94864 (Nikita Mikhaylov).
  • Ejecutar la purga de páginas sucias de jemalloc en un hilo distinto del hilo principal de MemoryWorker. Si la purga es lenta, podría retrasar la actualización del uso de RSS, lo que podría hacer que el proceso se finalice por falta de memoria. Se introduce una nueva configuración memory_worker_purge_total_memory_threshold_ratio para iniciar la purga de páginas sucias según la proporción del uso total de memoria. #94902 (Antonio Andelic).

Mejora

  • system.blob_storage_log ahora está disponible para Azure Blob Storage. #93105 (Alexey Milovidov).
  • Implementar blob_storage_log para Local y HDFS. Corregir un error cuando S3Queue utilizaba algo distinto del nombre del disco para registrar en blob_storage_log. Añadir la columna error_code a blob_storage_log. Dividir el archivo de configuración de pruebas para simplificar las pruebas en local. #93106 (Alexey Milovidov).
  • clickhouse-client y clickhouse-local resaltarán grupos de dígitos (miles, millones, etc.) dentro de los literales numéricos al escribir. Esto cierra #93100. #93108 (Alexey Milovidov).
  • Añade compatibilidad en clickhouse-client con argumentos de línea de comandos que tienen espacios alrededor del signo igual. Cierra #93077. #93174 (Cole Smith).
  • Con <interactive_history_legacy_keymap>true</interactive_history_legacy_keymap>, el cliente de la CLI ahora puede volver a usar Ctrl-R para la búsqueda normal, como antes, mientras que Ctrl-T realiza una búsqueda difusa. #87785 (Larry Snizek).
  • La sentencia para limpiar cachés SYSTEM DROP [...] CACHE daba la falsa impresión de que desactivaba la caché. ClickHouse ahora admite la sentencia SYSTEM CLEAR [...] CACHE, que resulta más clara. La sintaxis anterior sigue estando disponible. #93727 (Pranav Tiwari).
  • Permite usar varias columnas como clave primaria en EmbeddedRocksDB. Cierra #32819. #33917 (usurai).
  • Ahora ya es posible usar IN no constante con escalares (consultas como val1 NOT IN if(cond, val2, val3)). #93495 (Yarik Briukhovetskyi).
  • Evita que los encabezados x-amz-server-side-encryption se propaguen en las solicitudes S3 HeadObject, UploadPart y CompleteMultipartUpload, ya que no son compatibles. #64577 (Francisco J. Jurado Moreno).
  • Seguimiento del particionamiento de Hive en el modo ordered de S3Queue. Resuelve #71161. #81040 (Anton Ivashkin).
  • Optimiza la reserva de espacio en la caché del sistema de archivos. FileCache::collectCandidatesForEviction se ejecutará sin un bloqueo exclusivo. #82764 (Kseniia Sumarokova).
  • Permite una estrategia de rotación compuesta (tamaño + tiempo) para el log del servidor. #87620 (Jianmei Zhang).
  • El client de la CLI ahora puede especificar <warnings>false</warnings> en lugar de la opción de línea de comandos --no-warnings. #87783 (Larry Snizek).
  • Se añade compatibilidad para la función de agregación avg con valores Date, DateTime y Time como argumentos. Cierra #82267. #87845 (Yarik Briukhovetskyi).
  • La optimización use_join_disjunctions_push_down está habilitada de forma predeterminada. #89313 (Alexey Milovidov).
  • Se admiten más motores de tabla y tipos de fuentes de datos en las subconsultas correlacionadas. Cierra #80775. #90175 (Dmitry Novik).
  • Si el esquema de la vista parametrizada se especifica explícitamente, se muestra. Cierra #88875, #81385. #90220 (Grigorii Sokolik).
  • Gestiona correctamente la laguna en las entradas del log de Keeper si los logs son anteriores al último índice confirmado. #90403 (Antonio Andelic).
  • Se mejoró la configuración min_free_disk_bytes_to_perform_insert para que funcione correctamente con volúmenes JBOD. #90878 (Aleksandr Musorin).
  • Ahora se puede especificar la opción storage_class_name en las colecciones con nombre para el motor de tabla S3 y la función de tabla s3. #91926 (János Benjamin Antal).
  • Se admite la inserción en ZooKeeper auxiliar mediante system.zookeeper. #92092 (RinChanNOW).
  • Se agregan nuevas métricas para Keeper: los profile events KeeperChangelogWrittenBytes, KeeperChangelogFileSyncMicroseconds, KeeperSnapshotWrittenBytes y KeeperSnapshotFileSyncMicroseconds, así como las histogram metrics KeeperBatchSizeElements y KeeperBatchSizeBytes. #92149 (Miсhael Stetsyuk).
  • Se ha añadido una nueva configuración, trace_profile_events_list, que limita el trazado con trace_profile_event a la lista especificada de nombres de eventos. Esto permite una recopilación de datos más precisa en cargas de trabajo de gran tamaño. #92298 (Alexey Milovidov).
  • Compatibilidad con SYSTEM NOTIFY FAILPOINT para failpoints pausables. - Compatibilidad con SYSTEM WAIT FAILPOINT fp PAUSE/RESUME. #92368 (Shaohua Wang).
  • Agregar la columna creation (implícita/explícita) a system.data_skipping_indices. #92378 (Raúl Marín).
  • Permitir pasar la descripción de las columnas de las tablas dinámicas de YTsaurus a la fuente del diccionario. #92391 (MikhailBurdukov).
  • En #63985, hicimos posible especificar todos los parámetros necesarios para la configuración de TLS por puerto (consulte protocolos componibles), de modo que ya no dependemos de una configuración global de TLS. Sin embargo, la implementación sigue requiriendo implícitamente que exista una sección de configuración global openSSL.server, lo que entra en conflicto con entornos en los que se necesitan configuraciones de TLS distintas para diferentes puertos. Por ejemplo, en despliegues keeper-in-server, necesitamos configuraciones de TLS independientes para la comunicación entre instancias de Keeper y las conexiones del clickhouse client. #92457 (Miсhael Stetsyuk).
  • Se incorpora un nuevo ajuste input_format_binary_max_type_complexity que limita el número total de nodos de tipo que pueden decodificarse en formato binario para evitar payloads maliciosos. #92519 (Raufs Dunamalijevs).
  • Mostrar las tareas en ejecución en system.background_schedule_pool{,_log}. Añadir documentación. #92587 (Azat Khuzhin).
  • Ejecuta la consulta actual en la búsqueda con Ctrl+R en client si no se encuentra ninguna coincidencia en el historial. #92749 (Azat Khuzhin).
  • Se admite EXPLAIN indices = 1 como alias de EXPLAIN indexes = 1. Resuelve #92483. #92774 (Pranav Tiwari).
  • El lector de Parquet ahora permite leer columnas de tipo Tuple o Map como JSON: select x from file(f.parquet, auto, 'x JSON') funciona incluso si el tipo de la columna x en f.parquet es tuple o map. #92864 (Michael Kolupaev).
  • Se admiten tuplas vacías en el lector de Parquet. #92868 (Michael Kolupaev).
  • Se recurre a la copia en modo lectura y escritura para Azure Blob Storage cuando la copia nativa falla con BadRequest (p. ej., lista de bloques no válida). Anteriormente, esto solo se hacía para el error Unauthorized, que se observaba al copiar un blob entre distintas cuentas de almacenamiento. Pero a veces también vemos el error “The specified block list is invalid”. Así que ahora se ha actualizado la condición para recurrir a lectura y escritura en todos los fallos de la copia nativa. #92888 (Smita Kulkarni).
  • Se corrige el throttling del endpoint de metadatos de EC2 al ejecutar muchas consultas concurrentes de S3 con credenciales de perfil de instancia de EC2. Anteriormente, cada consulta creaba su propio AWSInstanceProfileCredentialsProvider, lo que provocaba solicitudes concurrentes al servicio de metadatos de EC2 y podía dar lugar a timeouts y errores HTTP response code: 403. Ahora, el proveedor de credenciales se almacena en caché y se comparte entre todas las consultas. #92891 (Sav).
  • Se ha rediseñado la configuración insert_select_deduplicate para permitir mantener la compatibilidad con versiones anteriores. #92951 (Sema Checherinda).
  • Registrar las tareas en segundo plano más lentas que la media (background_schedule_pool_log.duration_threshold_milliseconds=30) para evitar un registro excesivo de tareas. #92965 (Azat Khuzhin).
  • En versiones anteriores, algunos nombres de funciones de C++ se mostraban de forma incorrecta (“mangled”) en system.trace_log y system.symbols, y la función demangle no los procesaba correctamente. Cierra #93074. #93075 (Alexey Milovidov).
  • Se introdujo la opción de copia de seguridad backup_data_from_refreshable_materialized_view_targets para omitir la copia de seguridad de las vistas materializadas actualizables. Las RMV con estrategia de actualización APPEND siempre se respaldan. #93076 (Julia Kartseva). #93658 (Julia Kartseva)
  • Usar información de depuración mínima en lugar de no incluir información de depuración para unidades de traducción grandes, como las funciones. #93079 (Alexey Milovidov).
  • Se añadió compatibilidad con MinIO en el SDK de AWS S3 para C++ mediante la implementación de un mapeo de códigos de error para errores específicos de MinIO. Este cambio permite que ClickHouse gestione correctamente y reintente los errores del servidor de MinIO cuando se utilizan implementaciones de MinIO en lugar de AWS S3, lo que mejora la fiabilidad para los usuarios que ejecutan almacenamiento de objetos en clústeres de MinIO autogestionados. #93082 (XiaoBinMu).
  • Escribir perfiles simbolizados de jemalloc (lo que elimina la necesidad de un binario durante la generación de perfiles de heap). #93099 (Azat Khuzhin).
  • Se restauró la herramienta clickhouse git-import: fallaba con commits grandes y no válidos. Véase https://presentations.clickhouse.com/2020-matemarketing/. #93202 (Alexey Milovidov).
  • No mostrar las contraseñas del almacenamiento URL en el registro de consultas. #93245 (Konstantin Vedernikov).
  • Se añadió compatibilidad con el tipo Geometry en flipCoordinates. #93303 (Bharat Nallan).
  • Mejora la UX de SYSTEM INSTRUMENT ADD/REMOVE: usa literales String para los nombres de las funciones, parchea todas las funciones que coincidan y permite usar function_name en REMOVE. #93345 (Pablo Marcos).
  • Se añade una nueva configuración materialize_statistics_on_merge que permite activar o desactivar la materialización de estadísticas durante la fusión. El valor predeterminado es 1. #93379 (Han Fei).
  • ClickHouse ahora puede interpretar SELECT sin paréntesis alrededor de las consultas DESCRIBE SELECT. Cierra #58382. #93429 (Yarik Briukhovetskyi).
  • Añade aleatoriedad a las comprobaciones de corrección de la caché con una probabilidad determinada. #93439 (Kseniia Sumarokova).
  • Añadir la configuración type_json_allow_duplicated_key_with_literal_and_nested_object para permitir paths duplicados en JSON cuando uno es un literal y otro es un objeto anidado, por ejemplo {"a" : 42, "a" : {"b" : 42}}. Es posible que algunos datos se hayan creado antes de que se añadiera esta restricción sobre paths duplicados en https://github.com/ClickHouse/ClickHouse/pull/79317, y que ahora una manipulación posterior de esos datos provoque errores. Con esta configuración, esos datos antiguos aún pueden usarse sin errores. #93604 (Pavel Kruglov).
  • No se imprimen los valores de tipos simples en líneas separadas en Pretty JSON. #93836 (Pavel Kruglov).
  • Cuando hay muchas sentencias alter table ... modify setting ..., puede que no se adquiera el bloqueo en 5 segundos. Es mejor devolver timeout que error lógico. #93856 (Han Fei).
  • Se evita una salida excesiva ante un error de sintaxis. Antes de este cambio, se mostraba el script SQL completo, que podía contener muchas consultas. #93876 (Alexey Milovidov).
  • Cálculo correcto del tamaño en bytes de la solicitud check con estadísticas en Keeper. #93907 (Mikhail Artemenko).
  • Se añadió la configuración use_hash_table_stats_for_join_reordering para controlar si se utilizan estadísticas del tamaño de la tabla hash en tiempo de ejecución para reordenar joins. Esta configuración está habilitada de forma predeterminada, lo que conserva el comportamiento existente de collect_hash_table_stats_during_joins. #93912 (Vladimir Cherkasov).
  • Ahora los usuarios pueden ver parcialmente las opciones de configuración globales anidadas del servidor en la tabla system.server_settings (p. ej., logger.level). Esto solo cubre las opciones de configuración con una estructura fija (sin listas, enumeraciones, repeticiones, etc.). #94001 (Hechem Selmi).
  • QBit ahora se puede comparar por igualdad. #94078 (Raufs Dunamalijevs).
  • Cuando Keeper detecte un snapshot dañado o changelogs inconsistentes, que lance una excepción en lugar de abortar manualmente o limpiar los archivos automáticamente. Esto debería dar lugar a un comportamiento más seguro de Keeper, al depender de la intervención manual. #94168 (Antonio Andelic).
  • Se corrigió la posible presencia de restos en caso de que falle CREATE TABLE. #94174 (Azat Khuzhin).
  • Corrige el acceso a memoria no inicializada (un fallo en OpenSSL) cuando se usa una clave TLS protegida con contraseña. #94182 (Konstantin Bogdanov).
  • Actualiza chdig a la versión v26.1.1. #94290 (Azat Khuzhin).
  • Añade compatibilidad con un particionamiento más genérico para el modo ordered de S3Queue. #94321 (Bharat Nallan).
  • Se añadió el alias use_statistics para el ajuste allow_statistics_optimize. Esto es más coherente con los ajustes existentes use_primary_key y use_skip_indexes. #94366 (Robert Schulze).
  • Se habilitó la configuración input_format_numbers_enum_on_conversion_error para que, en la conversión de números a enums, se compruebe si el elemento existe. #94384 (Elmi Ahmadov).
  • En el modo ordered de S3(Azure)Queue, se limpian los nodos failed según los límites de seguimiento (antes esto solo se hacía en el modo Unordered, tanto para failed como para processed; ahora también se hará en Ordered, pero solo para los nodos failed). #94412 (Kseniia Sumarokova).
  • Se habilitó la gestión de acceso para el usuario default en clickhouse-local. El usuario default de clickhouse-local no tenía el privilegio access&#95;management, lo que hacía que operaciones como DROP ROW POLICY IF EXISTS fallaran con el error ACCESS_DENIED, aunque ese usuario no debería tener restricciones. #94501 (Alexey Milovidov).
  • Se habilita named collection para diccionarios y tablas de YTsaurus. #94582 (MikhailBurdukov).
  • Se añade compatibilidad con colecciones con nombre definidas mediante SQL en BACKUP/RESTORE para S3 y Azure Blob Storage. Cierra #94604. #94605 (Pablo Marcos).
  • Compatibilidad con la agrupación en buckets basada en la clave de partición para S3Queue en modo ordenado. #94698 (Bharat Nallan).
  • Añade una métrica asíncrona con el tiempo transcurrido del merge en ejecución más largo. #94825 (Raúl Marín).
  • Añadir una comprobación del archivo asociado antes de aplicar la eliminación por posición con IcebergBitmapPositionDeleteTransform. #94897 (Yang Jiang).
  • Ahora view_duration_ms muestra el tiempo durante el cual el grupo estuvo activo, no la suma de las duraciones de los hilos que contiene. #94966 (Sema Checherinda).
  • Se elimina el límite máximo del número de tokens de búsqueda en las funciones hasAnyTokens y hasAllTokens, que estaba fijado en 64. Ejemplo: SELECT count() FROM table WHERE hasAllTokens(text, ['token_1', 'token_2', [...], 'token_65']]); La consulta daría como resultado un error BAD_ARGUMENTS porque hay 65 tokens de búsqueda. Con este PR, el límite se ha eliminado por completo y la misma consulta se ejecutaría sin errores. #95152 (Elmi Ahmadov).
  • Se añade la configuración input_format_numbers_enum_on_conversion_error para que, en la conversión de números a Enums, se compruebe si el elemento existe. Cierra: #56144. #56240 (Nikolay Degterinsky).
  • Compartir recursos del analizador de formato entre la lectura del archivo de datos y del archivo de eliminación por posición en tablas Iceberg para reducir las asignaciones de memoria. #94701 (Yang Jiang).

Corrección de errores (mal funcionamiento visible para el usuario en una versión estable oficial)

  • Corrige un error por el que los manejadores de consultas predefinidas interpretaban los espacios en blanco finales como datos durante las operaciones de inserción. #83604 (Fabian Ponce).
  • Se corrige el error INCOMPATIBLE_TYPE_OF_JOIN para el almacenamiento Join cuando se aplica la optimización de outer join a inner join. Resuelve #80794. #84292 (Vladimir Cherkasov).
  • Se corrige la excepción “Invalid number of rows in Chunk” al usar hash join con allow_experimental_join_right_table_sorting activado. #86440 (yanglongwei).
  • Los nombres de archivo siempre se reemplazan por un hash en MergeTree si el sistema de archivos no distingue entre mayúsculas y minúsculas. Anteriormente, en sistemas de archivos que no distinguen entre mayúsculas y minúsculas (como MacOS), esto podía provocar corrupción de datos cuando varios nombres de columna/subcolumna diferían solo por el uso de mayúsculas y minúsculas. #86559 (Pavel Kruglov).
  • Añadir una comprobación completa de permisos durante la fase de creación de la consulta subyacente en una vista materializada. #89180 (pufit).
  • Se corrigió un fallo en la función icebergHash al usar un argumento constante. #90335 (Michael Kolupaev).
  • Corrige un error lógico cuando una mutación sin transacción modifica partes dentro de una transacción activa que finalmente se revierte. #90469 (Shaohua Wang).
  • Actualiza correctamente system.warnings después de convertir una base de datos ordinaria en una base de datos Atomic. #90473 (sdk2).
  • Corrige un error de aserción al leer un archivo Parquet, cuando una parte de una expresión prewhere se usa en otra parte de la consulta. #90635 (Max Kainov).
  • Se corrige un fallo en un clúster de un solo nodo al leer desde Iceberg en modo split-by-buckets. Cierra la issue #90913. #91553 (Konstantin Vedernikov).
  • Corrige un posible error lógico en el motor Log durante la lectura de subcolumnas. Cierra #91710. #91711 (Pavel Kruglov).
  • Se corrigió el error lógico: ‘Storage no admite transacción’ durante ATTACH AS REPLICATED. #91772 (Shaohua Wang).
  • Corrección de un problema por el que los filtros en tiempo de ejecución funcionaban incorrectamente cuando LEFT ANTI JOIN tenía una poscondición adicional. #91824 (Alexander Gololobov).
  • Corrige un error en una comparación null-safe que involucra el tipo Nothing. Cierra #91834. Cierra #84870. Cierra #91821. #91884 (Yarik Briukhovetskyi).
  • Corrige errores en la decodificación de DELTA_BYTE_ARRAY en el lector nativo de Parquet que afectaban a datos de tipo cadena muy repetitivos. #91929 (Daniel Muino).
  • Almacena en caché el esquema solo para el archivo a partir del cual se infirió en los globs, en lugar de para todos los archivos durante la inferencia del esquema. Cierra #91745. #92006 (Pavel Kruglov).
  • Corrige el error Couldn't pack tar archive: Failed to write all bytes causado por un encabezado incorrecto con el tamaño de la entrada del archivo. Soluciona #89075. #92122 (Julia Kartseva).
  • Liberar el flujo de solicitudes en insert select para evitar el cierre de la conexión HTTP. #92175 (Sema Checherinda).
  • Se corrige un error lógico en consultas con múltiples JOIN con la cláusula USING y join_use_nulls. #92251 (Vladimir Cherkasov).
  • Corrige un error lógico al reordenar join con join_use_nulls, cierra https://github.com/clickhouse/clickhouse/issues/90795. #92289 (Vladimir Cherkasov).
  • Corrige el formato inconsistente del AST de arrayElement con un literal negado. Cierra #92288 Cierra #92212 Cierra #91832 Cierra #91789 Cierra #91735 Cierra #88495 Cierra #92386. #92293 (Pavel Kruglov).
  • Se corrige un posible fallo con la configuración join_on_disk_max_files_to_merge. #92335 (Bharat Nallan).
  • issue relacionado con #https://github.com/ClickHouse/support-escalation/issues/6365. #92339 (Tuan Pham Anh).
  • Se corrige la falta de comprobación de acceso en SYSTEM SYNC FILE CACHE. Cierra #92101. #92372 (Kseniia Sumarokova).
  • Se corrigió el paso count_distinct_optimization sobre funciones de ventana y múltiples argumentos. #92376 (Raúl Marín).
  • Corrige el error “No se puede escribir en el búfer finalizado” al usar determinadas funciones de agregación con funciones de ventana. Cierra #91415. #92395 (Jimmy Aguilar Mena).
  • Corrige un error lógico al usar CREATE TABLE ... AS urlCluster() y el motor de base de datos Replicated. Cierra #92216. #92418 (Kseniia Sumarokova).
  • Hereda la configuración de la información de serialización de la parte de origen durante una mutación en MergeTree. Esto corrige un posible resultado incorrecto de la consulta sobre una parte mutada tras cambios en la serialización de los tipos de datos. #92419 (Pavel Kruglov).
  • Se corrige un posible conflicto entre una columna y una subcolumna con el mismo nombre que podía provocar el uso de una serialización incorrecta y fallos en las consultas. Cierra #90219. Cierra #85161. #92453 (Pavel Kruglov).
  • Se corrige un LOGICAL_ERROR causado por una modificación no deseada del plan de consulta al convertir un outer join en un inner join. También se flexibilizan los requisitos de la optimización para poder aplicarla en casos en los que se aplican funciones inyectivas a las claves de agregación en los joins. #92503 (János Benjamin Antal).
  • Corrige un posible error SIZES_OF_COLUMNS_DOESNT_MATCH al ordenar una columna Tuple vacía. Cierra #92422. #92520 (Pavel Kruglov).
  • Verificación de rutas tipadas incompatibles en el tipo JSON. Cierra #91577. #92539 (Pavel Kruglov).
  • Se corrigió el interbloqueo en SHOW CREATE DATABASE para la base de datos Backup. #92541 (Azat Khuzhin).
  • Usar el código de error correcto al validar el índice hypothesis. #92559 (Raúl Marín).
  • Se corrige la resolución de subcolumnas Dynamic en alias de columnas en el analizador. Anteriormente, la subcolumna Dynamic en un alias de columna se envolvía en getSubcolumn y, en algunos casos, ni siquiera podía resolverse. Cierra #91434. #92583 (Pavel Kruglov).
  • Se evita un fallo en tokens() con un segundo argumento NULL. #92586 (Raúl Marín).
  • Corrige un posible cierre inesperado provocado por una mutación in situ de las columnas const PREWHERE subyacentes. Esto podría haber ocurrido durante la reducción del tamaño de columnas (IColumn::shrinkToFit) o el filtrado (IColumn::filter), que podían activarse de forma concurrente en varios hilos. #92588 (Arsen Muk).
  • La creación y materialización de índices de texto en tablas que contienen partes de gran tamaño (más de 4.294.967.295 filas) está temporalmente deshabilitada. Esta limitación evita resultados incorrectos en las consultas, ya que la implementación actual del índice aún no admite partes tan grandes. #92644 (Anton Popov).
  • Corrige un error lógico Too large size (A) passed to allocator al ejecutar JOINs. Cierra #92043. #92667 (Yarik Briukhovetskyi).
  • Se corrige un error por el que los índices ngrambf_v1 con longitud de ngram (1.er parámetro) > 8 lanzaban una excepción. #92672 (Robert Schulze).
  • Se corrige una excepción no controlada durante la recarga en segundo plano de las colecciones con nombre cuando se usa almacenamiento de ZooKeeper. Cierra https://github.com/ClickHouse/clickhouse-private/issues/44180. #92717 (Kseniia Sumarokova).
  • Corrige la lógica incorrecta en las comprobaciones de grants de acceso con comodines. El intento anterior https://github.com/ClickHouse/ClickHouse/pull/90928 abordó una vulnerabilidad crítica, pero acabó siendo demasiado restrictivo, lo que hizo que algunas sentencias GRANT con comodines fallaran debido a revocaciones no relacionadas. #92725 (pufit).
  • Corrige un error en la lógica de omisión de datos al usar not match(...) en WHERE, que provocaba resultados incorrectos. Cierra #92492. #92726 (Nihal Z. Miaji).
  • No intente eliminar los directorios temporales al iniciar si se crea una tabla MergeTree en un disco de solo lectura. #92748 (Alexey Milovidov).
  • Se corrigió “Cannot add action to empty ExpressionActionsChain” para ALTER TABLE REWRITE PARTS (v2). #92754 (Azat Khuzhin).
  • Evita un fallo al leer desde una Connection desconectada. #92807 (Raufs Dunamalijevs).
  • Corrige el error lógico Failed to set file processing within 100 retries en el almacenamiento S3Queue en modo Ordered. Ahora se ha sustituido por una advertencia. Este error podía producirse antes de la versión 25.10 si la sesión de Keeper había expirado; sin embargo, seguirá siendo una advertencia en las versiones 25.10+, ya que aún es teóricamente posible que se produzca este error en caso de una alta concurrencia de procesamiento en modo Ordered. #92814 (Kseniia Sumarokova).
  • Antes, algunas consultas que usaban sharding por PK con una condición falsa fallaban. Ahora ya no fallan. Necesario para https://github.com/ClickHouse/ClickHouse/pull/89313. #92815 (Yarik Briukhovetskyi).
  • Se corrigió el cálculo de los tamaños sin comprimir de los índices de texto en la tabla system.parts. #92832 (Anton Popov).
  • Se corrigió el uso del índice primario en las actualizaciones ligeras que tienen una cláusula IN con subconsultas en el predicado de la cláusula WHERE. #92838 (Anton Popov).
  • Se corrigió la creación de la indicación de tipo para la ruta ‘skip’ en JSON. Cierra #92731. #92842 (Pavel Kruglov).
  • En el motor de tabla S3, debemos evitar almacenar en caché la clave de partición si hay funciones no deterministas. #92844 (Miсhael Stetsyuk).
  • Corrige un posible error FILE_DOESNT_EXIST tras la mutación de una columna dispersa con ratio_of_defaults_for_sparse_serialization=0.0. Cierra #92633. #92860 (Pavel Kruglov).
  • Corrige la inferencia del esquema de Parquet en el antiguo lector de Parquet (no se usa de forma predeterminada) cuando una columna JSON va después de una columna Tupe. Corrige el fallo del antiguo lector de Parquet (no se usa de forma predeterminada) con tuplas vacías. #92867 (Michael Kolupaev).
  • Corrige un error lógico con múltiples joins con una condición constante y join_use_nulls; cierra #92640. #92892 (Vladimir Cherkasov).
  • Corrige un posible error NOT_FOUND_COLUMN_IN_BLOCK durante la inserción en una tabla con una subcolumna en la expresión de partición. Cierra #93210. Cierra #83406. #92905 (Pavel Kruglov).
  • Corrige el error NO_SUCH_COLUMN_IN_TABLE en el motor Merge con tablas con alias. Cierra #88665. #92910 (Pavel Kruglov).
  • Se corrige el caso NULL != NULL para full_sorting_join en una columna LowCardinality(Nullable(T)). #92924 (Vladimir Cherkasov).
  • Se corrigieron varios cierres inesperados durante las fusiones de índices de texto en tablas MergeTree. #92925 (Anton Popov).
  • Se restauran las envolturas LowCardinality en los resultados de expresiones SET, cuando es necesario, durante la agregación con TTL para evitar excepciones durante la optimización de la tabla. #92971 (Seva Potapov).
  • Corrige un error lógico durante el análisis de índices cuando se usa un array vacío en la función has. Cierra #92906. #92995 (Nihal Z. Miaji).
  • Se corrige un posible bloqueo al finalizar el pool de programación en segundo plano (puede provocar bloqueos del servidor durante el apagado). #93008 (Azat Khuzhin).
  • Se corrige un posible error FILE_DOESNT_EXIST después de una mutación de una columna dispersa cuando la configuración ratio_of_defaults_for_sparse_serialization se cambiaba a 1.0 mediante alter. #93016 (Pavel Kruglov).
  • Se corrige un error en la lógica de omisión de datos al usar not materialize(...) o not CAST(...) en WHERE, que provocaba resultados incorrectos. Cierra #88536. #93017 (Nihal Z. Miaji).
  • Se corrige el posible uso de partes obsoletas debido a una race condition TOCTOU en las partes compartidas. #93022 (Azat Khuzhin).
  • Se corrige un bloqueo al deserializar un estado de agregación groupConcat malformado con desplazamientos fuera de rango. #93028 (Raufs Dunamalijevs).
  • Se corrige un problema que dejaba la conexión en un estado incorrecto tras la cancelación preliminar de consultas distribuidas. #93029 (Azat Khuzhin).
  • Corrige los resultados del join cuando la clave de join del lado derecho es una columna dispersa. Esto cierra #92920. Solo puedo reproducir el error con set compatibility='23.3'. No estoy seguro de si debería retroportarse. #93038 (Amos Bird).
  • Se soluciona un posible Cannot finalize buffer after cancellation en estimateCompressionRatio(). Soluciona: #87380. #93068 (Azat Khuzhin).
  • Se corrigieron las fusiones de índices de texto basados en expresiones complejas (como concat(col1, col2)). #93073 (Anton Popov).
  • Se corrige la aplicación de la proyección cuando el filtro contiene subcolumnas. Cierra #92882. #93141 (Pavel Kruglov).
  • Se corrigió un error lógico que se producía en algunos casos al añadir filtros en tiempo de ejecución de join al plan de consulta. Se debía a que se devolvían incorrectamente columnas const duplicadas desde uno de los lados del join. #93144 (Alexander Gololobov).
  • La función especial __applyFilter utilizada por los filtros de tiempo de ejecución de JOIN devolvía ILLEGAL_TYPE_OF_ARGUMENT en algunos casos válidos. #93187 (Alexander Gololobov).
  • Evita que distintas columnas interpoladas se fusionen en la misma columna dentro de un bloque cuando las columnas interpoladas son, en la práctica, alias de la misma columna. #93197 (Yakov Olkhovskiy).
  • No añadir un filtro en tiempo de ejecución al hacer join con la tabla del lado derecho ya rellenada. #93211 (Alexander Gololobov).
  • Se corrige la limpieza de los watches persistentes de Keeper tras una sesión finalizada. Cierra #92480. #93213 (Konstantin Vedernikov).
  • Se corrige el uso de ORDER BY con tuplas en Iceberg. Esto cierra #92977. #93225 (Konstantin Vedernikov).
  • Se corrige un fallo en la configuración s3queue_migrate_old_metadata_to_buckets de S3Queue. Cierra #93392, #93196, #81739. #93232 (Kseniia Sumarokova).
  • Se eliminan las columnas no utilizadas cuando la proyección se reconstruye durante la fusión. Esto reduce el uso de memoria y crea menos partes temporales. #93233 (Nikolai Kochetov).
  • Se corrige la eliminación de columnas no utilizadas de subconsultas cuando hay una subconsulta escalar correlacionada. Antes de esta corrección, una columna podía eliminarse si solo se usaba en la subconsulta correlacionada, y la consulta fallaba con el error NOT_FOUND_COLUMN_IN_BLOCK. #93273 (Dmitry Novik).
  • Corrige la posible falta de una subcolumna en una MV durante un ALTER de la tabla de origen. Cierra #93231. #93276 (Pavel Kruglov).
  • Corrige en el analizador la planificación de consultas del motor de tabla Merge, que podía lanzar ILLEGAL_COLUMN para hostName() al fusionar tablas locales y remotas/Distributed. Cierra #92059. #93286 (Jinlin).
  • Corrige un caso en el que NOT IN con argumentos de Array no constantes devolvía un valor incorrecto, y añade compatibilidad con funciones de Array no constantes. Cierra #14980. #93314 (Yarik Briukhovetskyi).
  • Se corrige el error Not found column en la optimización use_top_k_dynamic_filtering. Corrige #93186. #93316 (Nikolai Kochetov).
  • Se corrigió la reconstrucción de los índices de texto creados sobre subcolumnas. #93326 (Anton Popov).
  • Se corrigió el manejo de un array vacío como segundo argumento de las funciones hasAllTokens y hasAnyTokens. #93328 (Anton Popov).
  • Se corrigió un error lógico al usar filtros de tiempo de ejecución en una consulta con totales para la tabla del lado derecho. #93330 (Alexander Gololobov).
  • El servidor ya no falla si se llama a la función tokens con parámetros del tokenizer no constantes (el 2.º, 3.º y 4.º parámetro), p. ej., SELECT tokens(NULL, 1, materialize(1)). #93383 (Robert Schulze).
  • Se corrigió una vulnerabilidad por desbordamiento de enteros en la deserialización del estado de groupConcat que podía provocar problemas de seguridad de la memoria con estados de agregación manipulados. #93426 (Raufs Dunamalijevs).
  • Se corrigió el análisis del índice de texto en columnas de tipo array cuando el índice no contiene tokens (todos los arrays están vacíos o el tokenizador omite todos los tokens). #93457 (Anton Popov).
  • Evita el inicio de sesión mediante OAuth en ClickHouse Client cuando el nombre de usuario y la contraseña están en la cadena de conexión. #93459 (Krishna Mannem).
  • Corregir la compatibilidad con las credenciales proporcionadas de Azure ADLS Gen2 en DataLakeCatalog: interpretar las claves adls.sas-token.* de los catálogos REST de Iceberg y corregir el análisis de las URL ABFSS. #93477 (Karun Anantharaman).
  • Se corrigió la compatibilidad con GLOBAL IN en el analizador (antes, el Set se volvía a crear en el nodo remoto). #93507 (Azat Khuzhin).
  • Se corrigió la extracción de la subcolumna durante la deserialización directamente en columnas dispersas. #93512 (Pavel Kruglov).
  • Se corrigió la lectura directa desde el índice de texto en consultas de búsqueda duplicadas. #93516 (Anton Popov).
  • Corrección del error NOT_FOUND_COLUMN_IN_BLOCK cuando el runtime filter está habilitado y las tablas unidas devuelven la misma columna varias veces (p. ej., SELECT a, a, a FROM t). #93526 (Alexander Gololobov).
  • Se corrigió un error por el que clickhouse-client pedía la contraseña dos veces al conectarse mediante ssh. #93547 (Isak Ellmer).
  • Asegúrese de que ZooKeeper finalice correctamente al apagarse (corrige un posible bloqueo durante el apagado en casos muy poco probables). #93602 (Azat Khuzhin).
  • Se corrigió LOGICAL_ERROR al restaurar ReplicatedMergeTree con una condición de carrera en la deduplicación. #93612 (Pablo Marcos).
  • Se corrige el uso de columnas dispersas en la actualización de TTL durante la deserialización directa en columnas dispersas en algunos formatos de entrada. Esto corrige el posible error lógico Unexpected type of result TTL column. #93619 (Pavel Kruglov).
  • Se corrigieron las funciones de índice H3 que a veces fallaban o se quedaban bloqueadas al llamarse con valores de entrada no válidos. #93657 (Michael Kolupaev).
  • El uso del índice ngram_bf en datos no UTF-8 provocó una lectura de memoria no inicializada, con valores que podían quedar en la estructura del índice resultante. Cierra #92576. #93663 (Alexey Milovidov).
  • Comprobar que el tamaño del búfer descomprimido sea el esperado. #93690 (Raúl Marín).
  • Impedir que los usuarios obtengan la lista de columnas de una tabla sin verificar el permiso SHOW COLUMNS mediante el motor de tabla merge. #93695 (János Benjamin Antal).
  • Se corrigió la materialización de los índices de omisión creados a partir de subcolumnas. #93708 (Anton Popov).
  • Guardamos los punteros compartidos a los almacenamientos en QueryPipeline::resources::storage_holders para garantizar que los objetos IStorage no se destruyan mientras PipelineExecutor siga activo. #93746 (Miсhael Stetsyuk).
  • Se corrige el problema al adjuntar BD Replicated cuando el host entre servidores cambiaba tras reiniciar. #93779 (Tuan Pham Anh).
  • Se corrige la aserción !read_until_position en ReadBufferFromS3, que se producía cuando la caché estaba habilitada. #93809 (Kseniia Sumarokova).
  • Corrige un error lógico en un caso poco frecuente en el que se usa una tupla vacía con una columna Map. Cierra #93784. #93814 (Nihal Z. Miaji).
  • Se corrigió la corrupción de _part_offset al reconstruir las proyecciones durante las fusiones, y se optimizó el procesamiento de proyecciones al evitar lecturas innecesarias de la columna _part_offset y omitir columnas no necesarias en los cálculos de proyecciones. Esto da continuidad a las optimizaciones introducidas en #93233. #93827 (Amos Bird).
  • Se elimina el manejo de ‘Bad version’. #93843 (Anton Ivashkin).
  • Se corrige que optimize_inverse_dictionary_lookup no funcionara con una consulta distribuida cuando la clave es de tipo entero con signo. Cierra #93259. #93848 (Nihal Z. Miaji).
  • Se corrigió que lag/lead no funcionaran con la consulta distribuida remote(). Cierra #90014. #93858 (Nihal Z. Miaji).
  • Se corrigió un error en el envío de instrumentación del sistema. #93937 (Pablo Marcos).
  • En https://github.com/ClickHouse/ClickHouse/pull/89173, añadimos un campo adicional a la estructura que TraceSender envía a través de una tubería interna. Sin embargo, no se actualizó el tamaño del búfer (aquí), por lo que estamos escribiendo más datos en el búfer de los que permite buffer_size, lo que provoca múltiples flushes. Además, como TraceSender::send se llama desde distintos hilos, los flushes de esos hilos pueden intercalarse, lo que rompe el invariante del que depende el extremo receptor (TraceCollector). #93966 (Miсhael Stetsyuk).
  • Se corrige la conversión de tipos al supertipo durante la operación JOIN del motor de almacenamiento Join con la cláusula USING. Corrige #91672. Corrige #78572. #94000 (Dmitry Novik).
  • Corrección de un problema por el que FilterStep no se añadía correctamente cuando se aplicaba un runtime filter de join sobre una tabla Merge. #94021 (Alexander Gololobov).
  • Una consulta SELECT que incluía un predicado sobre varias columnas con índices de omisión de bloom filter, y en la que había condiciones OR y NOT, podía devolver resultados incoherentes. Esto ya se ha corregido. #94026 (Shankar Iyer).
  • Se corrige CLEAR en una columna con índices dependientes. #94057 (Raúl Marín).
  • Se corrigió el uso de un valor sin inicializar en ReadWriteBufferFromHTTP. #94058 (Alexey Milovidov).
  • Corrige una comprobación errónea de las rutas tipadas en JSON. La comprobación se introdujo en https://github.com/ClickHouse/ClickHouse/pull/92842 y puede provocar un error al iniciar tablas existentes. #94070 (Pavel Kruglov).
  • Se corrige el cierre inesperado durante el análisis del filtro cuando hay un OUTER JOIN. Corrige #90979. #94080 (Dmitry Novik).
  • Se corrigió la precisión de uniqTheta al usar claves de agregación UInt8 en paralelo (max_threads > 1, valor predeterminado). #94095 (Azat Khuzhin).
  • Se corrige un fallo provocado por una excepción lanzada desde una llamada a socket.setBlocking(true) dentro de SCOPE_EXIT. #94100 (Miсhael Stetsyuk).
  • Se corrige la pérdida de datos cuando DROP PARTITION elimina partes creadas por entradas de log posteriores en ReplicatedMergeTree. #94123 (Tuan Pham Anh).
  • Se corrigió un problema en el lector de Parquet v3, que manejaba incorrectamente los arrays que cruzan los límites de página. Esto ocurre, por ejemplo, con archivos escritos por Arrow sin habilitar las estadísticas de página ni el índice de página. Afecta solo a las columnas del tipo de dato Array. El síntoma más probable es que un array cada ~1 MB de datos quede truncado. Antes de esta corrección, use esta configuración como solución alternativa: input_format_parquet_use_native_reader_v3 = 0. #94125 (Michael Kolupaev).
  • Se corrige el exceso de watches en ReplicatedMergeTree mientras se espera una entrada del log. #94133 (Azat Khuzhin).
  • Funciones arrayShuffle, arrayPartialShuffle y arrayRandomSample para materializar columnas constantes, de modo que distintas filas obtengan resultados diferentes. #94134 (Joanna Hulboj).
  • Se corrige una condición de carrera en la evaluación de funciones de tabla en vistas materializadas. #94171 (Alexey Milovidov).
  • Corrige una desreferenciación de nullptr en los motores de base de datos PostgreSQL (cuando la consulta es incorrecta). Cierra #92887. #94180 (Alexey Milovidov).
  • Corrige una fuga de memoria en vistas materializadas actualizables que utilizan consultas SELECT con múltiples subconsultas. #94200 (Antonio Andelic).
  • Soluciona una condición de carrera entre DataPartStorageOnDiskBase::remove y system.parts. Cierra #49076. #94262 (Alexey Milovidov).
  • Se elimina el especificador noexcept incorrecto en la asignación por copia de HashTable, que puede provocar un crash (std::terminate) en caso de excepciones de memoria. #94275 (Nikita Taranov).
  • Anteriormente, al crear una proyección con columnas duplicadas en GROUP BY (p. ej., GROUP BY c0, c0) e insertar datos, se producía un std::length_error si optimize_row_order está habilitado. Cierra #94065. #94277 (Alexey Milovidov).
  • Se corrige un error poco frecuente en el client de ZooKeeper durante la conexión que provoca cuelgues y fallos. #94320 (Azat Khuzhin).
  • Se corrige un problema por el que la optimización de función a subcolumnas no se aplicaba a las subcolumnas. #94323 (Pavel Kruglov).
  • Se corrige un posible resultado incorrecto en RIGHT JOIN anidados cuando enable_lazy_columns_replication está habilitado. El error provocaba que todas las filas de las columnas replicadas devolvieran incorrectamente el mismo valor en lugar de sus valores correspondientes. Cierra #93891. #94339 (Vladimir Cherkasov).
  • Se corrige el pushdown de filtros en SEMI JOIN mediante conjuntos de equivalencia. No se aplica el pushdown del filtro si han cambiado los tipos de los argumentos. Corrige #93264. #94340 (Dmitry Novik).
  • Corrige el uso de DeltaLake CDF con el motor de base de datos DataLake (integración de catálogos de delta lake). Cierra #94122. #94342 (Kseniia Sumarokova).
  • Se corrigió el valor incorrecto de la métrica FilesystemCacheSizeLimit cuando se usaba la política de caché SLRU. #94363 (Kseniia Sumarokova).
  • Crear un motor de base de datos Backup con menos de dos argumentos ahora devuelve un mensaje de error más descriptivo (Wrong number of arguments en lugar de std::out_of_range: InlinedVector::at(size_type) const failed bounds check.). #94374 (Robert Schulze).
  • Ignora las revocaciones imposibles de privilegios globales a nivel de base de datos para privilegios con opción de otorgamiento. #94386 (pufit).
  • Se corrigió la lectura de desplazamientos dispersos en partes compactas. Cierra #94385. #94399 (Pavel Kruglov).
  • No impedir ALTER de columnas con índices implícitos, incluso si se usa el modo throw de alter_column_secondary_index_mode. #94425 (Raúl Marín).
  • Se corrige un crash en TCPHandler cuando varias llamadas a receivePacketsExpectQuery leen Protocol::Client::IgnoredPartUUIDs. #94434 (Miсhael Stetsyuk).
  • Se corrige el enmascaramiento de datos sensibles en system.functions. #94436 (Vitaly Baranov).
  • Corrige la desreferenciación de nullptr con send_profile_events deshabilitado. Esta funcionalidad se introdujo recientemente en el driver de Python de ClickHouse. Cierra #92488. #94466 (Alexey Milovidov).
  • Corrige la incompatibilidad de .mrk del índice de texto durante las operaciones de merge. #94494 (Peng Jian).
  • Cuando read_in_order_use_virtual_row está habilitado, el código accedía a las columnas del índice basándose en el tamaño completo de la clave primaria sin comprobar si el índice se había truncado, lo que provocaba acceso a memoria ya liberada / memoria sin inicializar. Cierra #85596. #94500 (Alexey Milovidov).
  • Corrige un error causado por una incompatibilidad de tipos al enviar tablas externas para subconsultas con GLOBAL IN cuando los tipos son Nullable. Cierra #94097. #94511 (Alexey Milovidov).
  • En versiones anteriores, las consultas con múltiples condiciones de índice sobre la misma expresión podían lanzar por error la excepción Not found column. Cierra #60660. #94515 (Alexey Milovidov).
  • Se corrige el manejo incorrecto de la columna Nullable del join en los filtros en tiempo de ejecución. #94555 (Alexander Gololobov).
  • La creación de una carga de trabajo dentro de otra que está actualmente en uso ya no provoca un fallo. #94599 (Sergei Trifonov).
  • Se corrige un fallo en la optimización de ANY LEFT JOIN cuando se evalúa isNotNull sobre una columna ausente. #94600 (Molly).
  • Corregida la evaluación de expresiones por defecto al hacer referencia a otras columnas con valores por defecto calculados. #94615 (Alexey Milovidov).
  • Corrige problemas de permisos en las operaciones de BACKUP/RESTORE. #94617 (Pablo Marcos).
  • Se corrige un cierre inesperado debido a una conversión de tipo incorrecta cuando el tipo de dato es Nullable(DateTime64). #94627 (Miсhael Stetsyuk).
  • Corrige un error por el que ciertas consultas distribuidas con ORDER BY podían devolver columnas ALIAS con los valores intercambiados (es decir, la columna a mostraba los datos de la columna b y viceversa). #94644 (filimonov).
  • Se corrigió el guardado de los resultados de keeper-bench en un archivo. #94654 (Antonio Andelic).
  • Corrige estimaciones incorrectas con estadísticas de tipo MinMax cuando la columna contiene valores de coma flotante negativos. #94665 (zoomxi).
  • Se corrige la lectura de archivos Parquet cuando la clave de un map es un struct. #94670 (Konstantin Vedernikov).
  • Corrige un posible resultado incorrecto de RIGHT join al usar condiciones ON complejas. Cierra #92913. #94680 (Vladimir Cherkasov).
  • Preservar la granularidad constante del índice (use_const_adaptive_granularity) después de las fusiones verticales. #94725 (Azat Khuzhin).
  • Corrige un error en mutaciones con subconsultas escalares y dependencias de una tabla. Si una tabla tenía dependencias (índice o proyecciones) sobre una columna, las subconsultas escalares podían evaluarse y almacenarse en caché sin ningún dato, lo que podía provocar cambios incorrectos. #94731 (Raúl Marín).
  • Se corrigió el fallback de cpu_pressure de AsynchronousMetrics en caso de error. #94827 (Raúl Marín).
  • A la función getURLHostRFC le faltaban comprobaciones de límites antes de desreferenciar punteros. Cuando se pasaba una cadena vacía a domainRFC, se leía memoria sin inicializar, lo que desencadenaba errores de MSan. #94851 (Alexey Milovidov).
  • Corregir el modo de solo lectura de los discos cifrados. #94852 (Azat Khuzhin).
  • Corrige un error lógico en LIMIT/OFFSET con valores fraccionarios al usar el analizador antiguo con tablas Distributed. Cierra #94712. #94999 (Ahmed Gouda).
  • Se corrige un fallo que se producía en determinadas condiciones cuando los filtros de ejecución de JOIN están habilitados de forma predeterminada. #95000 (Alexander Gololobov).
  • Mejora del enmascaramiento de contraseñas en la URL utilizada en el motor de tabla URL() y la función de tabla url(). #95006 (Vitaly Baranov).
  • La función toStartOfInterval ahora funciona igual que toStartOfX, donde X es Day, Week, Month, Quarter, Year, cuando enable_extended_results_for_datetime_functions está activado. #95011 (Kirill Kopnev).
  • Corrige las comparaciones de cadenas constantes que no tenían en cuenta las opciones cast_string_to_date_time_mode, bool_true_representation, bool_false_representation e input_format_null_as_default. Cierra #91681. #95040 (Nihal Z. Miaji).
  • Se corrige una condición de carrera en la caché del sistema de archivos. #95064 (Alexey Milovidov).
  • Se corrige una condición de carrera poco frecuente en el lector de Parquet. #95068 (Alexey Milovidov).
  • Se corrige un fallo en la optimización top K cuando LIMIT es cero. Cierra #93893. #95072 (Alexey Milovidov).
  • Al convertir DateTime/enteros a Time64, se extrae el componente de hora del día mediante toTime, que no es monótono. La plantilla ToDateTimeMonotonicity afirmaba erróneamente que esta conversión era monótona, lo que provocaba la excepción “Invalid binary search result in MergeTreeSetIndex” en las compilaciones de depuración. #95125 (Alexey Milovidov).
  • La lista de entradas del archivo manifest se volvió a crear solo cuando fue necesario (anteriormente se hacía en cada iteración). #95162 (Daniil Ivanik).

Mejora en compilación/pruebas/empaquetado

Última modificación el 10 de junio de 2026