メインコンテンツへスキップ
このページでは、PostgreSQL を ClickHouse と統合するための以下のオプションについて説明します。
  • PostgreSQL のテーブルから読み取るために PostgreSQL テーブルエンジンを使用する方法
  • PostgreSQL のデータベースを ClickHouse のデータベースと同期するために、実験的な MaterializedPostgreSQL データベースエンジンを使用する方法
Managed Postgres サービスもご覧ください。コンピュートと物理的に同一配置された NVMe storage を採用しており、EBS のようなネットワーク接続型ストレージを使用する代替手段と比べて、ディスク I/O がボトルネックになるワークロードで最大 10 倍高速なパフォーマンスを実現します。さらに、ClickPipes の Postgres CDC (変更データキャプチャ) コネクタを使用して、Postgres のデータを ClickHouse にレプリケートできます。

PostgreSQL テーブルエンジンを使用する

PostgreSQL table engineを使用すると、ClickHouse からリモートの PostgreSQL server に保存されているデータに対して、SELECT および INSERT 操作を実行できます。 この記事では、1 つのテーブルを使ったインテグレーションの基本的な方法を説明します。

1. PostgreSQL の設定

  1. postgresql.conf に、PostgreSQL がネットワークインターフェイスで待ち受けるよう、次の設定項目を追加します:
  listen_addresses = '*'
  1. ClickHouse から接続するためのユーザーを作成します。ここではデモ用に、この例では superuser の全権限を付与します。
  CREATE ROLE clickhouse_user SUPERUSER LOGIN PASSWORD 'ClickHouse_123';
  1. PostgreSQLで新しいデータベースを作成します。
  CREATE DATABASE db_in_psg;
  1. 新しいテーブルを作成します。
  CREATE TABLE table1 (
      id         integer primary key,
      column1    varchar(10)
  );
  1. テスト用に数行追加してみましょう。
  INSERT INTO table1
    (id, column1)
  VALUES
    (1, 'abc'),
    (2, 'def');
  1. レプリケーション用に、新しいユーザーで新しいデータベースへの接続を許可するよう PostgreSQL を設定するには、pg_hba.conf ファイルに次のエントリを追加します。アドレス行は、PostgreSQL サーバーのサブネットまたは IP アドレスに更新してください。
  # TYPE  DATABASE        USER            ADDRESS                 METHOD
  host    db_in_psg             clickhouse_user 192.168.1.0/24          password
  1. pg_hba.conf の設定を再読み込みします (ご利用のバージョンに応じて、このコマンドを調整してください) :
  /usr/pgsql-12/bin/pg_ctl reload
  1. 新しい clickhouse_user でログインできることを確認します:
  psql -U clickhouse_user -W -d db_in_psg -h <your_postgresql_host>
この機能を ClickHouse Cloud で使用している場合は、ClickHouse Cloud の IP アドレスから PostgreSQL インスタンスにアクセスできるよう許可が必要になることがあります。 送信トラフィックの詳細については、ClickHouse の Cloud Endpoints API を参照してください。

2. ClickHouseでテーブルを定義する

  1. clickhouse-client に接続します:
  clickhouse-client --user default --password ClickHouse123!
  1. 新しいデータベースを作成します。
  CREATE DATABASE db_in_ch;
  1. PostgreSQL を使用するテーブルを作成します:
  CREATE TABLE db_in_ch.table1
  (
      id UInt64,
      column1 String
  )
  ENGINE = PostgreSQL('postgres-host.domain.com:5432', 'db_in_psg', 'table1', 'clickhouse_user', 'ClickHouse_123');
必要な最小限のパラメータは次のとおりです。
parameterDescriptionexample
host:portホスト名または IP アドレスとポートpostgres-host.domain.com:5432
databasePostgreSQL のデータベース名db_in_psg
userPostgreSQL に接続するユーザー名clickhouse_user
passwordPostgreSQL に接続するパスワードClickHouse_123
パラメータの完全な一覧については、PostgreSQL テーブルエンジン のドキュメントページを参照してください。

3 インテグレーションをテストする

  1. ClickHouse で初期状態の行を確認します:
  SELECT * FROM db_in_ch.table1
ClickHouse のテーブルには、PostgreSQL のテーブルにすでに存在していた 2 行が自動的に取り込まれるはずです:
  Query id: 34193d31-fe21-44ac-a182-36aaefbd78bf

  ┌─id─┬─column1─┐
  │  1 │ abc     │
  │  2 │ def     │
  └────┴─────────┘
  1. PostgreSQL に戻り、テーブルに数行追加します。
  INSERT INTO table1
    (id, column1)
  VALUES
    (3, 'ghi'),
    (4, 'jkl');
  1. この 2 行の新しい行が ClickHouse のテーブルに表示されるはずです。
  SELECT * FROM db_in_ch.table1
応答は次のようになります。
  Query id: 86fa2c62-d320-4e47-b564-47ebf3d5d27b

  ┌─id─┬─column1─┐
  │  1 │ abc     │
  │  2 │ def     │
  │  3 │ ghi     │
  │  4 │ jkl     │
  └────┴─────────┘
  1. ClickHouseのテーブルに行を追加すると何が起こるか見てみましょう:
  INSERT INTO db_in_ch.table1
    (id, column1)
  VALUES
    (5, 'mno'),
    (6, 'pqr');
  1. ClickHouse で追加した行が、PostgreSQL のテーブルに表示されるはずです:
  db_in_psg=# SELECT * FROM table1;
  id | column1
  ----+---------
    1 | abc
    2 | def
    3 | ghi
    4 | jkl
    5 | mno
    6 | pqr
  (6 rows)
この例では、PostrgeSQL テーブルエンジンを使用して、PostgreSQL と ClickHouse の基本的なインテグレーションを紹介しました。 スキーマの指定、一部のカラムだけを返す方法、複数のレプリカへの接続など、さらに多くの機能については、PostgreSQL テーブルエンジンのドキュメントページを参照してください。あわせて、ClickHouse and PostgreSQL - a match made in data heaven - part 1 のブログもご覧ください。

MaterializedPostgreSQL データベースエンジンを使用する

PostgreSQL データベースエンジンは、PostgreSQL のレプリケーション機能を使用して、すべてまたは一部のスキーマとテーブルを含むデータベースのレプリカを作成します。 この記事では、1 つのデータベース、1 つのスキーマ、1 つのテーブルを使用したインテグレーションの基本的な方法を説明します。 以下の手順では、PostgreSQL CLI (psql) と ClickHouse CLI (clickhouse-client) を使用します。PostgreSQL サーバーは Linux にインストールされているものとします。以下は、PostgreSQL データベースが新規のテストインストールである場合の最小構成です

1. PostgreSQL で

  1. postgresql.conf で、最小の listen レベル、レプリケーション用の wal level、および replication slots を設定します。
次のエントリを追加します:
listen_addresses = '*'
max_replication_slots = 10
wal_level = logical
*ClickHouse では、wal level が少なくとも logical であり、レプリケーションスロットが少なくとも 2 つ必要です
  1. 管理者アカウントを使用して、ClickHouse から接続するユーザーを作成します:
CREATE ROLE clickhouse_user SUPERUSER LOGIN PASSWORD 'ClickHouse_123';
*デモ目的のため、完全なスーパーユーザー権限が付与されています。
  1. 新しいデータベースを作成します:
CREATE DATABASE db1;
  1. psql で新しいデータベースに接続します:
\connect db1
  1. 新しいテーブルを作成します:
CREATE TABLE table1 (
    id         integer primary key,
    column1    varchar(10)
);
  1. 初期の行を追加します:
INSERT INTO table1
(id, column1)
VALUES
(1, 'abc'),
(2, 'def');
  1. 新しいユーザーが新しいデータベースにレプリケーション用で接続できるよう、PostgreSQL を設定します。以下は、pg_hba.conf ファイルに追加する最小限のエントリです。
# TYPE  DATABASE        USER            ADDRESS                 METHOD
host    db1             clickhouse_user 192.168.1.0/24          password
*説明のため、ここでは平文パスワード認証方式を使用しています。PostgreSQL のドキュメントに従って、address 行をサブネットまたはサーバーのアドレスに更新してください
  1. 次のように pg_hba.conf の設定を再読み込みします (使用しているバージョンに合わせて調整してください) :
/usr/pgsql-12/bin/pg_ctl reload
  1. 新しいclickhouse_userでのログインをテストします:
 psql -U clickhouse_user -W -d db1 -h <your_postgresql_host>

2. ClickHouse で

  1. ClickHouse CLI にログインします
clickhouse-client --user default --password ClickHouse123!
  1. データベースエンジン用の PostgreSQL 実験的機能を有効にします:
SET allow_experimental_database_materialized_postgresql=1
  1. レプリケーション対象の新しいデータベースを作成し、初期テーブルを定義します:
CREATE DATABASE db1_postgres
ENGINE = MaterializedPostgreSQL('postgres-host.domain.com:5432', 'db1', 'clickhouse_user', 'ClickHouse_123')
SETTINGS materialized_postgresql_tables_list = 'table1';
最小限必要なオプション:
parameterDescriptionexample
host:portホスト名または IP アドレスとポートpostgres-host.domain.com:5432
databasePostgreSQL データベース名db1
userPostgreSQL に接続するユーザー名clickhouse_user
passwordPostgreSQL に接続するパスワードClickHouse_123
settingsエンジンの追加設定materialized_postgresql_tables_list = ‘table1’
PostgreSQL データベースエンジンの詳細なガイドについては、https://clickhouse.com/docs/engines/database-engines/materialized-postgresql/#settings を参照してください。
  1. 初期テーブルにデータがあることを確認します:
ch_env_2 :) select * from db1_postgres.table1;

SELECT *
FROM db1_postgres.table1
Query id: df2381ac-4e30-4535-b22e-8be3894aaafc

┌─id─┬─column1─┐
│  1 │ abc     │
└────┴─────────┘
┌─id─┬─column1─┐
│  2 │ def     │
└────┴─────────┘

3. 基本的なレプリケーションをテストする

  1. PostgreSQL で新しい行を追加します:
INSERT INTO table1
(id, column1)
VALUES
(3, 'ghi'),
(4, 'jkl');
  1. ClickHouse で、新しい行が表示されていることを確認します:
ch_env_2 :) select * from db1_postgres.table1;

SELECT *
FROM db1_postgres.table1
Query id: b0729816-3917-44d3-8d1a-fed912fb59ce

┌─id─┬─column1─┐
│  1 │ abc     │
└────┴─────────┘
┌─id─┬─column1─┐
│  4 │ jkl     │
└────┴─────────┘
┌─id─┬─column1─┐
│  3 │ ghi     │
└────┴─────────┘
┌─id─┬─column1─┐
│  2 │ def     │
└────┴─────────┘

4. まとめ

このインテグレーションガイドでは、テーブルを含むデータベースをレプリケートするシンプルな例を中心に説明しましたが、データベース全体をレプリケートしたり、既存のレプリケーションに新しいテーブルやスキーマを追加したりする、より高度なオプションもあります。このレプリケーションでは DDL コマンドはサポートされていませんが、構造変更が行われた際に変更を検出し、テーブルを再読み込みするようにエンジンを設定できます。
高度なオプションで利用できる機能の詳細については、リファレンスドキュメントを参照してください。
最終更新日 2026年6月10日