Esta é a Parte 2 de um guia sobre a migração do PostgreSQL para o ClickHouse. Com um exemplo prático, ela demonstra como realizar a migração de forma eficiente com uma abordagem de replicação em tempo real (CDC). Muitos dos conceitos abordados também se aplicam a transferências manuais de grandes volumes de dados do PostgreSQL para o ClickHouse.A maioria das consultas SQL do seu ambiente PostgreSQL deve funcionar no ClickHouse sem modificações e provavelmente será executada mais rapidamente.
Desduplicação com CDC
Otimize consultas no ClickHouse
Para simplificar, as consultas abaixo omitem o uso de técnicas de desduplicação dos dados.
As contagens aqui diferem ligeiramente, pois os dados do Postgres contêm apenas linhas que satisfazem a integridade referencial das chaves estrangeiras. O ClickHouse não impõe essas restrições e, portanto, tem o dataset completo, por exemplo, incluindo usuários anônimos.Users (com mais de 10 perguntas) que recebem mais visualizações:
tags recebem mais visualizações: