chDB - ClickHouse Documentation

chDB 是一款快速的进程内 SQL OLAP 引擎，由 ClickHouse v25.8.2.1 驱动。如果你想在编程语言中获得 ClickHouse 的强大能力，又无需连接到 ClickHouse 服务器，就可以使用它。

主要特性

进程内 SQL OLAP 引擎 - 由 ClickHouse 提供支持，无需安装 ClickHouse 服务器
多种数据格式 - 支持 Parquet、CSV、JSON、Arrow、ORC 等输入与输出，以及另外 70 多种格式
尽量减少数据拷贝 - 借助 python memoryview 实现从 C++ 到 Python 的高效传递
丰富的 Python 生态集成 - 原生支持 Pandas、Arrow、DB API 2.0，可无缝融入现有数据科学工作流
零依赖 - 无需安装外部数据库
DataStore API - 提供兼容 Pandas 的 API，并具备 SQL 优化能力，支持 630+ 个方法

DataStore：兼容 Pandas 的 API

新功能！ DataStore 提供与 pandas 兼容的 API，将熟悉的 pandas 语法与 ClickHouse 的高性能结合起来。

在 Hex 上快速上手

📖 入门教程 — 设置你的首个连接
🚀 Hex 30 天延长试用 — 可完整使用 ClickHouse 集成

一行代码迁移

# 只需更改导入语句——您的 pandas 代码无需任何修改即可运行
- import pandas as pd
+ from chdb import datastore as pd

df = pd.read_csv("data.csv")
result = df[df['age'] > 25].groupby('city')['salary'].mean()

性能亮点

操作	pandas	DataStore	加速比
GroupBy 计数	347ms	17ms	19.93x
复杂管道	2,047ms	380ms	5.39x
Filter+Sort+Head	1,537ms	350ms	4.40x

基于 1000 万行数据的基准测试

DataStore 功能

630+ 个 API 方法 - 209 个 pandas DataFrame 方法，185+ 个 accessor 方法
惰性求值 - 操作会编译为优化后的 SQL
SQL 下推 - 过滤器和聚合会在数据源端执行
通用数据源 - 可从文件、S3、数据库和数据湖读取

了解更多：DataStore 文档

chDB 支持哪些语言？

chDB 提供以下语言绑定：

如何开始？

如果你使用的是 Go、Rust、Node.js、Bun 或 C and C++，请参阅相应的语言页面。
如果你使用的是 Python，请参阅入门开发者指南或 chDB 点播课程。

面向 pandas 用户

先从 DataStore API 开始，获得熟悉的 pandas 使用体验，同时兼具 ClickHouse 的性能：

DataStore 快速入门 - 安装与一行迁移
从 pandas 迁移 - 分步迁移指南
Pandas Cookbook - 常见用法
关键差异 - 与 pandas 的重要区别
性能指南 - 优化提示

DataStore API 参考文档

工厂方法 - 从文件、数据库和云存储创建
查询构建 - SQL 风格的操作
Pandas 兼容性 - 209 个兼容方法
Accessors - .str, .dt, .arr, .json, .url, .ip, .geo
配置 - 引擎、日志、性能分析
调试 - explain()、性能分析、日志

SQL API 指南

介绍视频

观看一段 chDB 简介，了解它如何将 ClickHouse 的强大能力带到你的 Python 环境中：

性能基准测试

chDB 在各种场景下都展现出卓越的性能：

嵌入式引擎的 ClickBench - SQL API 性能对比
DataFrame Benchmark - DataFrame 引擎对比
DataStore 对比 Pandas - 常见操作下，速度最高可达 pandas 的 20 倍

关于 chDB

在 blog 上阅读 chDB 项目诞生的完整故事
在 Blog 上了解 chDB 及其应用场景
参加 chDB 点播课程
通过 codapi 示例在浏览器中体验 chDB
更多示例请参见 (https://github.com/chdb-io/chdb/tree/main/examples)

许可

chDB 采用 Apache License 2.0 版本发布。更多信息请参见 LICENSE。

​主要特性

​DataStore：兼容 Pandas 的 API

​一行代码迁移

​性能亮点

​DataStore 功能

​chDB 支持哪些语言？

​如何开始？

​面向 pandas 用户

​DataStore API 参考文档

​SQL API 指南

​介绍视频

​性能基准测试

​关于 chDB

​许可

主要特性

DataStore：兼容 Pandas 的 API

一行代码迁移

性能亮点

DataStore 功能

chDB 支持哪些语言？

如何开始？

面向 pandas 用户

DataStore API 参考文档

SQL API 指南

介绍视频

性能基准测试

关于 chDB

许可