一键在 AWS 上部署 LiteLLM 代理,让团队通过统一 API Key 使用 Bedrock Claude 全系列模型。
Bedrock 管模型和推理 → LiteLLM 管人和成本 → CloudFront 管安全
| 痛点 | 方案 |
|---|---|
| 每个开发者都要配 AWS 凭证 | 统一 API Key,按人分配、按人计费 |
| 无法控制模型用量和成本 | per-key 限速限额 + 实时用量看板 |
| 想用 Claude Code 但只有 Bedrock | OpenAI + Anthropic 双格式兼容 |
| 模型偶尔报错影响开发 | 自动 Fallback,3 次失败切备用模型 |
| Prompt Caching 想省钱 | Bedrock 原生支持,~90% input 成本节省 |
详细架构说明 → docs/architecture.md
AWS CLI v2 · Terraform ≥ 1.5 · kubectl · Helm 3 · envsubst
git clone https://github.com/cncoder/serverless-litellm.git
cd serverless-litellm
# 交互式一键部署(约 15-20 分钟)
./scripts/setup.sh安装:
# macOS / Linux / WSL(推荐)
curl -fsSL https://claude.ai/install.sh | bash
# npm
npm install -g @anthropic-ai/claude-code配置 — 写入 ~/.claude/settings.json,只需替换 2 个值:
验证:claude --print "hello"
切换模型:claude --model claude-opus-4-7 / claude --model opus / claude --model claude-sonnet-4-6
详细配置(可选参数、迁移指南、Prompt Caching、Troubleshooting)→ docs/claude-code.md
| 文档 | 说明 |
|---|---|
| ⭐ Claude Code 配置 | settings.json 模板、模型选择、迁移指南 |
| ⭐ 架构设计 | 网络拓扑、安全机制、计算层 |
| 可用模型 | 模型列表、Fallback 链、路由策略 |
| API 调用示例 | OpenAI SDK / Anthropic SDK / cURL |
| 手动部署 | Terraform 变量、分步部署 |
| 故障排查 | 真实生产环境经验 |
| Bedrock 监控 | 用量监控与成本分析 |
| 测试指南 | 功能 / 性能 / HA / 安全 |
| OpenClaw 集成 | OpenClaw Agent 框架对接 |
├── terraform/ # 基础设施(EKS, VPC, RDS, ECR, WAF)
├── kubernetes/ # K8s 资源(Deployment, Service, Ingress, HPA)
├── scripts/ # 一键部署 + Claude Code 配置
├── skills/ # Claude Code Skills
└── docs/ # 详细文档
MIT
{ "env": { "ANTHROPIC_BASE_URL": "https://<your-domain>", // ← 替换 "ANTHROPIC_API_KEY": "<your-litellm-key>", // ← 替换 "DISABLE_TELEMETRY": "1", "DISABLE_ERROR_REPORTING": "1", "DISABLE_BUG_COMMAND": "1", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1" }, "model": "claude-opus-4-7", "smallFastModel": "claude-haiku-4-5" }