Google Kubernetes Engine (GKE)
LoadBalancer DNS 解析问题
- OTel collector 日志中出现包含集群 IP 地址的“connection refused”错误
- OpAMP 连接失败,例如:
dial tcp 34.118.227.30:4320: connect: connection refused
GKE 的其他注意事项
Amazon EKS
Azure AKS
生产环境 Cloud 部署检查清单
- 使用外部域名/IP 正确配置
frontendUrl - 配置启用 TLS 的入口,以提供 HTTPS 访问
- 如果遇到连接问题,请使用 FQDN 覆盖
otel.opampServerUrl(尤其是在 GKE 上) - 根据你的 pod (容器组) 网络 CIDR 调整
clickhouse.config.clusterCidrs - 为生产工作负载配置持久化存储
- 设置合适的资源请求和限制
- 启用监控和告警
- 配置备份和灾难恢复
- 实施适当的 Secret 管理
生产环境最佳实践
资源管理
高可用性
持久存储
- GKE:
pd-ssd或pd-balanced - EKS:
gp3或io2 - AKS:
managed-premium或managed-csi
浏览器兼容性说明
后续步骤
- 配置指南 (v1.x) - API 密钥、Secret 和入口
- 部署选项 (v1.x) - 外部系统配置
- Helm 主要指南 (v1.x) - 基础安装
- Cloud 部署 (v2.x) - v2.x 云指南
- 升级指南 - 从 v1.x 迁移到 v2.x