Duplicar los datos de origen en otro lugar
Instantáneas del sistema de archivos
SELECT.
Las instantáneas en esas réplicas quedarán fuera del alcance de cualquier consulta que modifique datos.
Como ventaja adicional, estas réplicas podrían tener configuraciones de hardware especiales con más
discos conectados a cada servidor, lo que resultaría rentable.
Para volúmenes de datos más pequeños, también podría funcionar un simple INSERT INTO ... SELECT ... hacia tablas remotas.
Manipulación de partes
ALTER TABLE ... FREEZE PARTITION ... para crear
una copia local de las particiones de una tabla. Esto se implementa mediante enlaces físicos al directorio /var/lib/clickhouse/shadow/,
por lo que normalmente no consume espacio adicional en disco para los datos antiguos. Las
copias creadas de los archivos no las gestiona el servidor ClickHouse, por lo que puedes simplemente dejarlas allí:
tendrás una copia de seguridad sencilla que no requiere ningún sistema externo adicional,
pero seguirá siendo vulnerable a problemas de hardware. Por este motivo, es mejor
copiarlas de forma remota a otra ubicación y luego eliminar las copias locales.
Los sistemas de archivos distribuidos y los almacenamientos de objetos siguen siendo buenas opciones para esto,
pero también pueden servir servidores de archivos normales montados, siempre que tengan capacidad suficiente
(en este caso, la transferencia se realizará a través del sistema de archivos de red o quizá con rsync).
Los datos se pueden restaurar desde la copia de seguridad usando ALTER TABLE ... ATTACH PARTITION ...
Para obtener más información sobre las consultas relacionadas con la manipulación de particiones, consulta la
documentación de ALTER.
Hay una herramienta de terceros disponible para automatizar este enfoque: clickhouse-backup.