- ClickHouseを立ち上げて使い始めるには、クイックスタートをご覧ください
- ClickHouse チュートリアルでは、ニューヨーク市のタクシー乗車データセットを分析します
| ページ | 説明 |
|---|---|
| Amazonのカスタマーレビュー | Amazon製品に関する1億5,000万件超のカスタマーレビュー |
| AMPLab Big Data Benchmark | データウェアハウスソリューションの性能比較に用いられるベンチマーク用データセット。 |
| ClickHouseによるStack Overflowデータの分析 | ClickHouseによるStack Overflowデータの分析 |
| 匿名化されたWeb分析 | hits と visits を含む、匿名化されたWeb分析データで構成される2つのテーブルからなるデータセット |
| Brown University Benchmark | 機械生成ログデータ向けの新しい分析ベンチマーク |
| COVID-19 オープンデータ | COVID-19 Open-Data は、COVID-19 の疫学データに加え、人口統計、経済、政府対応などの関連要因も含む大規模なオープンソースデータベースです |
| dbpedia データセット | Wikipedia の100万件の記事とそれらのベクトル埋め込みを含むデータセット |
| 環境センサーデータ | オープンな環境データを作成する、コミュニティ主導のグローバルなセンサーネットワークである Sensor.Community のデータを200億件以上収録したデータセット。 |
| Foursquare の場所データ | 店舗、レストラン、公園、遊び場、記念碑など、地図上のさまざまな場所に関する情報を収録した、1億件を超えるレコードを含むデータセット。 |
| 基地局データセットを使用したGeoデータ | OpenCelliD のデータを ClickHouse に読み込み、Apache Superset を ClickHouse に接続して、データに基づくダッシュボードを構築する方法を学びます |
| GitHub イベントデータセット | 2011 年から 2020 年 12 月 6 日までの GitHub 上のすべてのイベントを含む、31 億件のレコードで構成されるデータセット。 |
| Hacker News dataset | Hacker Newsデータ2,800万行を含むデータセット。 |
| Hacker Newsベクトル検索データセット | 2,800万件超のHacker News投稿とそのベクトル埋め込みを含むデータセット |
| LAION 5Bデータセット | LAION 5Bデータセットの1億個のベクトルを収録したデータセット |
| Laion-400Mデータセット | 英語の画像キャプションが付いた4億枚の画像を収録したデータセット |
| New York Public Library “What’s on the Menu?” データセット | ホテル、レストラン、カフェのメニューに掲載された料理とその価格に関する130万件の歴史的データを収録したデータセット。 |
| ニューヨークのタクシーデータ | 2009年以降にニューヨーク市で発生した、タクシーおよび配車車両 (Uber、Lyft など) の数十億件に及ぶ乗車データ |
| NOAA Global Historical Climatology Network | 過去120年分、25億行の気候データ |
| NYPD苦情データ | 5つの手順でタブ区切り値 (TSV) データを取り込み、クエリする |
| OnTime | 航空便の定時運航実績に関するデータセット |
| Star Schema Benchmark (SSB, 2009) | Star Schema Benchmark (SSB) のデータセットとクエリ |
| 台湾の過去の気象データセット | 過去128年分の気象観測データ1億3,100万行 |
| Criteoのテラバイト級クリックログ | Criteoのクリックログ1テラバイト分 |
| 英国の不動産価格データセット | イングランドとウェールズの不動産取引価格データを含む英国の不動産データセットを使って、頻繁に実行するクエリのパフォーマンスをprojectionsで向上させる方法を学びます |
| TPC-DS (2012) | TPC-DS ベンチマークのデータセットとクエリです。 |
| TPC-H (1999) | TPC-H ベンチマークのデータセットとクエリです。 |
| WikiStat | 0.5 兆件のレコードを含む WikiStat データセットを確認できます。 |
| GitHubデータを使ってClickHouseでクエリを作成する | ClickHouseリポジトリのすべてのコミットと変更を含むデータセット |
| YouTubeの低評価データセット | YouTube動画の低評価を集めたデータセット。 |