Предварительные требования
- Amazon RDS Postgres
- Amazon Aurora Postgres
- Supabase Postgres
- Google Cloud SQL Postgres
- Azure Flexible Server for Postgres
- Neon Postgres
- Crunchy Bridge Postgres
- Generic Postgres Source, если вы используете любого другого провайдера Postgres или самоуправляемый экземпляр.
- TimescaleDB, если вы используете расширение TimescaleDB в управляемом сервисе или самоуправляемом экземпляре.
Создание ClickPipe
- В консоли ClickHouse Cloud перейдите в свой сервис ClickHouse Cloud.
- Выберите кнопку
Data Sourcesв меню слева и нажмите “Set up a ClickPipe”
-
Выберите плитку
Postgres CDC
Добавление подключения к исходной базе данных Postgres
- Заполните сведения о подключении к исходной базе данных Postgres, которую вы настроили на этапе предварительной подготовки.
Прежде чем вводить сведения о подключении, убедитесь, что IP-адреса ClickPipes добавлены в белый список в правилах вашего межсетевого экрана. Список IP-адресов ClickPipes можно найти здесь.
Дополнительные сведения см. в руководствах по настройке исходной базы данных Postgres, ссылки на которые приведены в верхней части этой страницы.
(Необязательно) Настройка AWS Private Link
(Необязательно) Настройка SSH-туннелирования
- Включите переключатель “Use SSH Tunnelling”.
- Заполните сведения об SSH-подключении.
-
Чтобы использовать аутентификацию по ключу, нажмите “Revoke and generate key pair”, чтобы сгенерировать новую пару ключей, затем скопируйте созданный открытый ключ на SSH-сервер в
~/.ssh/authorized_keys. - Нажмите “Verify Connection”, чтобы проверить подключение.
Убедитесь, что IP-адреса ClickPipes добавлены в список разрешённых в правилах межсетевого экрана для SSH-бастиона, чтобы ClickPipes мог установить SSH-туннель.
Настройка параметров репликации
- Убедитесь, что вы выбрали слот репликации в раскрывающемся списке, созданном на этапе предварительной подготовки.
Дополнительные настройки
- Sync interval: Интервал, с которым ClickPipes будет опрашивать исходную базу данных на наличие изменений. Он влияет на целевой сервис ClickHouse, поэтому, если для вас важна стоимость, рекомендуем установить большее значение (свыше
3600). - Parallel threads for initial load: Количество параллельных воркеров, которые будут использоваться для получения начального снимка. Это полезно, если у вас много таблиц и вы хотите контролировать число параллельных воркеров для получения начального снимка. Этот параметр задается отдельно для каждой таблицы.
- Pull batch size: Количество строк, извлекаемых за один батч. Это параметр типа best effort, поэтому он может соблюдаться не во всех случаях.
- Snapshot number of rows per partition: Количество строк, извлекаемых в каждой партиции при создании начального снимка. Это полезно, если в ваших таблицах много строк и вы хотите контролировать, сколько строк извлекается в каждой партиции.
- Snapshot number of tables in parallel: Количество таблиц, которые будут извлекаться параллельно при создании начального снимка. Это полезно, если у вас много таблиц и вы хотите контролировать число таблиц, извлекаемых параллельно.
Настройка таблиц
- Здесь можно выбрать целевую базу данных для вашего ClickPipe. Вы можете выбрать существующую базу данных или создать новую.
- Вы можете выбрать таблицы, которые хотите реплицировать из исходной базы данных Postgres. При выборе таблиц можно также переименовать их в целевой базе данных ClickHouse и исключить отдельные столбцы.
Проверьте разрешения и запустите ClickPipe
- Выберите роль “Full access” в раскрывающемся списке разрешений и нажмите “Complete Setup”.