- ClickHouseをセットアップして使い始めるには、クイックスタート をご覧ください
- ClickHouseチュートリアル では、ニューヨーク市のタクシー乗車データセットを分析します
| ページ | 説明 |
|---|---|
| Amazon カスタマーレビュー | Amazon 製品に関する1億5,000万件超のカスタマーレビュー |
| AMPLab Big Data Benchmark | データウェアハウジングソリューションの性能比較に使用されるベンチマーク用データセット。 |
| ClickHouseでStack Overflowデータを分析する | ClickHouseでStack Overflowデータを分析する |
| 匿名化されたWebアナリティクス | 匿名化されたWebアナリティクスデータを含む2つのテーブル (hits と visits) で構成されるデータセット |
| ブラウン大学ベンチマーク | 機械生成ログデータ向けの新しい分析ベンチマーク |
| COVID-19 オープンデータ | COVID-19 Open-Data は、COVID-19 の疫学データに加え、人口統計、経済、政府対応などの関連要因も含む、大規模なオープンソースのデータベースです |
| dbpedia データセット | Wikipedia の記事 100 万件とそのベクトル埋め込みを含むデータセット |
| 環境センサーデータ | オープン環境データを作成する、コミュニティ主導のグローバルなセンサーネットワーク Sensor.Community のデータを 200 億件以上収録したデータセット |
| Foursquareの場所データ | 店舗、レストラン、公園、遊び場、記念碑など、地図上のさまざまな場所に関する情報を含む、1億件超のレコードで構成されるデータセット。 |
| 基地局データセットを使用したGeoデータ | OpenCelliD のデータを ClickHouse に読み込み、Apache Superset を ClickHouse に接続し、そのデータに基づくダッシュボードを構築する方法を学びます |
| GitHub イベントデータセット | 2011 年から 2020 年 12 月 6 日までの GitHub 上のすべてのイベントを含む、31 億件のレコードからなるデータセットです。 |
| Hacker News dataset | Hacker Newsデータ2,800万行を含むデータセット。 |
| Hacker Newsベクトル検索データセット | 2,800万件超のHacker News投稿とそのベクトル埋め込みを含むデータセット |
| LAION 5Bデータセット | LAION 5Bデータセットから1億件のベクトルを収録したデータセット |
| Laion-400Mデータセット | 英語の画像キャプション付き画像4億枚を収録したデータセット |
| ニューヨーク公共図書館 “What’s on the Menu?” データセット | ホテル、レストラン、カフェのメニューに掲載された料理とその価格に関する過去のデータ130万件を収録したデータセット。 |
| ニューヨークのタクシーデータ | 2009年以降にニューヨーク市で発生した、タクシーおよび配車車両 (Uber、Lyft など) の数十億件に及ぶ移動データ |
| NOAA Global Historical Climatology Network | 過去120年間の気候データ25億行 |
| NYPD 苦情データ | Tab Separated Value データを 5 つの手順で取り込み、クエリする |
| OnTime | 航空便の定時運航実績を収録したデータセット |
| Star Schema Benchmark (SSB, 2009) | Star Schema Benchmark (SSB) のデータセットとクエリ |
| 台湾の過去の気象データセット | 過去128年間の気象観測データ1億3,100万行分 |
| Criteoのテラバイト級クリックログ | Criteoのクリックログ1テラバイト分 |
| 英国の不動産価格データセット | イングランドおよびウェールズの不動産取引価格データを含む英国の不動産データセットを使って、頻繁に実行するクエリのパフォーマンスを向上させるための projections の使い方を学びます |
| TPC-DS (2012) | TPC-DS ベンチマークのデータセットとクエリ。 |
| TPC-H (1999) | TPC-H ベンチマークのデータセットとクエリ。 |
| WikiStat | 5,000億件のレコードを含む WikiStat データセットを見てみましょう。 |
| GitHubデータを使ってClickHouseでクエリを実行する | ClickHouseリポジトリのすべてのコミットと変更を含むデータセット |
| YouTubeの低評価データセット | YouTube動画の低評価を集めたデータセット |