跳转到主要内容
chDB 是一款快速的进程内 SQL OLAP 引擎,由 ClickHouse v25.8.2.1 驱动。 如果你想在编程语言中获得 ClickHouse 的强大能力,又无需连接到 ClickHouse 服务器,就可以使用它。

主要特性

  • 进程内 SQL OLAP 引擎 - 由 ClickHouse 提供支持,无需安装 ClickHouse 服务器
  • 多种数据格式 - 支持 Parquet、CSV、JSON、Arrow、ORC 等输入与输出,以及另外 70 多种格式
  • 尽量减少数据拷贝 - 借助 python memoryview 实现从 C++ 到 Python 的高效传递
  • 丰富的 Python 生态集成 - 原生支持 Pandas、Arrow、DB API 2.0,可无缝融入现有数据科学工作流
  • 零依赖 - 无需安装外部数据库
  • DataStore API - 提供兼容 Pandas 的 API,并具备 SQL 优化能力,支持 630+ 个方法

DataStore:兼容 Pandas 的 API

新功能! DataStore 提供与 pandas 兼容的 API,将熟悉的 pandas 语法与 ClickHouse 的高性能结合起来。
在 Hex 上快速上手

一行代码迁移

# 只需更改导入语句——您的 pandas 代码无需任何修改即可运行
- import pandas as pd
+ from chdb import datastore as pd

df = pd.read_csv("data.csv")
result = df[df['age'] > 25].groupby('city')['salary'].mean()

性能亮点

操作pandasDataStore加速比
GroupBy 计数347ms17ms19.93x
复杂管道2,047ms380ms5.39x
Filter+Sort+Head1,537ms350ms4.40x
基于 1000 万行数据的基准测试

DataStore 功能

  • 630+ 个 API 方法 - 209 个 pandas DataFrame 方法,185+ 个 accessor 方法
  • 惰性求值 - 操作会编译为优化后的 SQL
  • SQL 下推 - 过滤器和聚合会在数据源端执行
  • 通用数据源 - 可从文件、S3、数据库和数据湖读取
了解更多:DataStore 文档

chDB 支持哪些语言?

chDB 提供以下语言绑定:

如何开始?

面向 pandas 用户

先从 DataStore API 开始,获得熟悉的 pandas 使用体验,同时兼具 ClickHouse 的性能:

DataStore API 参考文档

SQL API 指南

介绍视频

观看一段 chDB 简介,了解它如何将 ClickHouse 的强大能力带到你的 Python 环境中:

性能基准测试

chDB 在各种场景下都展现出卓越的性能:

关于 chDB

许可

chDB 采用 Apache License 2.0 版本发布。更多信息请参见 LICENSE
最后修改于 2026年6月10日