Auténtico sistema de gestión de bases de datos orientado a columna
Compresión de datos
Almacenamiento de datos en disco
Procesamiento en paralelo en múltiples núcleos
Procesamiento distribuido en varios servidores
Compatibilidad con SQL
Motor de computación vectorial
Inserciones de datos en tiempo real
Tener los datos ordenados físicamente por la clave primaria permite extraerlos en función de valores concretos o rangos de valores con baja latencia, en menos de unas decenas de milisegundos.
Índices secundarios
Adecuado para consultas en línea
Soporte para cálculos aproximados
- Funciones de agregación para calcular de forma aproximada el número de valores distintos, las medianas y los cuantiles.
- Ejecutar una consulta basada en una parte (SAMPLE) de los datos y obtener un resultado aproximado. En este caso, se recupera proporcionalmente menos datos del disco.
- Ejecutar una agregación sobre un número limitado de claves aleatorias, en lugar de sobre todas las claves. En determinadas condiciones de distribución de claves en los datos, esto proporciona un resultado razonablemente preciso con un menor uso de recursos.
Algoritmo de join adaptativo
Soporte para la replicación y la integridad de los datos
Control de acceso basado en roles
Características que pueden considerarse desventajas
- No hay transacciones completas.
- No es posible modificar ni eliminar datos ya insertados a gran velocidad y con baja latencia. Hay eliminaciones y actualizaciones por lotes disponibles para limpiar o modificar datos, por ejemplo, para cumplir con el GDPR.
- El índice disperso hace que ClickHouse no sea tan eficiente para consultas puntuales que recuperan una sola fila por su clave.