Databricks での API の選択
| Unity Catalog の状態 | 推奨 API | 注記 |
|---|---|---|
| 有効 (デフォルト) | TableProvider API (フォーマットベース) | Unity Catalog により Spark のカタログ登録はブロックされます |
| 無効 (No isolation shared) | Catalog API | ”No isolation shared” アクセスモードのクラスターが必要です |
Databricks へのインストール
オプション 1: Databricks UI から JAR をアップロードする
-
ランタイム JAR をビルドするか、ダウンロードします。
-
JAR を Databricks のワークスペースにアップロードします。
- Workspace に移動し、目的のフォルダーを開きます
- Upload をクリックし、JAR ファイルを選択します
- JAR はワークスペースに保存されます
-
クラスターにライブラリをインストールします。
- Compute に移動し、対象のクラスターを選択します
- Libraries タブをクリックします
- Install New をクリックします
- DBFS または Workspace を選択し、アップロードした JAR ファイルを指定します
- Install をクリックします
- ライブラリを読み込むため、クラスターを再起動します
オプション 2: Databricks CLI でインストール
オプション 3: Maven Coordinates (推奨)
-
Databricksワークスペースに移動します:
- Compute → クラスターを選択します
- Libraries タブをクリックします
- Install New をクリックします
- Maven タブを選択します
- Maven coordinatesを追加します:
- Install をクリックし、ライブラリを読み込むためにクラスターを再起動します
TableProvider API を使用する
データの読み込み
- Python
- Scala
データの書き込み
- Python
- Scala
この例では、Databricks でシークレットスコープが事前設定されていることを前提としています。設定手順については、Databricks の Secret management のドキュメント を参照してください。
Databricks 固有の考慮事項
アクセスモードの要件
| Access Mode | Unity Catalog | Supported |
|---|---|---|
| Dedicated (Single User) | 有効 | ✅ はい |
| Dedicated (Single User) | 無効 | ✅ はい |
| Standard (Shared) | 有効 | ❌ いいえ |
| Standard (Shared) | 無効 | ✅ はい |
シークレット管理
ClickHouse Cloud への接続
- HTTPS プロトコルを使用します (
protocol: https,http_port: 8443) - SSLを有効にします (
ssl: true)
例
完全なワークフローの例
- Python
- Scala
- Spark Native Connector Guide - コネクタに関する完全なドキュメント
- TableProvider API Documentation - フォーマットベースのアクセスの詳細
- Catalog API Documentation - カタログベースのアクセスの詳細