前置条件
- 能够使用具有复制权限的用户访问源 PostgreSQL 数据库。请按照与您的数据源对应的设置指南进行配置:
- 准备一个 ClickHouse Managed Postgres 服务作为迁移目标。如果您还没有,请参阅快速入门。
- 在本地计算机上安装
pg_dump和psql。两者都包含在标准 PostgreSQL 客户端工具中。
迁移前注意事项
- DDL 传播:持续复制 (CDC) 会捕获 DML 操作和
ADD COLUMN。其他 DDL 更改 (如DROP COLUMN和ALTER COLUMN) 不会自动传播,必须在目标端手动执行。
如果您在迁移过程中遇到问题,请查看 Managed Postgres Migrations FAQ,了解常见错误及其解决方案。
步骤 1:连接到源数据库
- 初始加载 + CDC — 先复制现有数据,然后持续将后续变更同步到目标端。
- 仅初始加载 — 一次性复制,不进行持续复制。
- 仅 CDC — 跳过初始复制,仅复制从此刻开始产生的新变更。
第 2 步:导出数据库 schema
pg_dump 命令。在终端中运行该命令:
pg.sql。
点击 Next。
第 3 步:将 schema 导入到你的 Managed Postgres 服务
psql 命令,用于将 schema 转储应用到你的 Managed Postgres 服务。请在终端中运行该命令:
Step 4: 配置摄取设置
| 设置 | 默认值 | 说明 |
|---|---|---|
| 同步间隔 (秒) | 10 | 轮询 replication slot 的频率 |
| 初始加载的并行线程数 | 4 | 批量复制阶段使用的线程数 |
| 拉取批次大小 | 100,000 | 每个复制批次拉取的行数 |
| 每个分区快照的行数 | 100000 | 大表快照的分区大小 |
| 并行创建快照的表数量 | 1 | 并行执行快照的表数量 |