API 概览
Fast AI API 的基本信息、Base URL、鉴权方式和支持的接口。
鉴权
Bearer sk-fastai.run-...
标准 Bearer Token,在控制台创建 API Key。
协议兼容
OpenAI / Anthropic
同一把 Key 同时兼容两种 API 协议。
Base URL
所有 API 请求使用以下 Base URL:
提示
Base URL
https://api.fastai.run/v1支持的接口
当前网关对外暴露以下 API 接口。
| 接口 | 方法 | 说明 |
|---|---|---|
| /v1/chat/completions | POST | OpenAI Chat Completions API(最常用) |
| /v1/completions | POST | OpenAI Legacy Completions API |
| /v1/messages | POST | Anthropic Messages API |
| /v1/responses | POST | OpenAI Responses API |
| /v1/embeddings | POST | 文本向量化 |
| /v1/moderations | POST | 内容审核 |
| /v1/rerank | POST | 重排序 |
| /v1/images/generations | POST | 图像生成 |
| /v1/images/edits | POST | 图像编辑 |
| /v1/edits | POST | Legacy Edits 兼容接口 |
| /v1/audio/speech | POST | 文本转语音 |
| /v1/audio/transcriptions | POST | 音频转写 |
| /v1/audio/translations | POST | 音频翻译 |
| /v1/models | GET | 获取当前 Key 可用模型列表 |
| /v1/dashboard/billing/subscription | GET | OpenAI 兼容订阅/额度查询 |
| /v1/dashboard/billing/usage | GET | OpenAI 兼容用量查询 |
| /v1/usage | GET | 查询当前 API Key、当前 Key 绑定/可达权益的用量视图 |
用量查询
可以直接使用 API Key 查询这把 Key 的近期使用情况,以及这把 Key 当前绑定、历史实际使用过或当前可访问的权益剩余额度。
- 不需要额外登录态,只要带 API Key 即可。
- 默认返回该 Key 最近 20 条请求记录,可通过
limit参数指定 1-100 条。 - 返回包含
api_key、current_entitlement、all_entitlements三个层级,适合 IDE skill、CLI 或自定义监控脚本直接消费。 - 为了兼容 CC Switch / usage script,同时提供顶层
remaining、unit、balance、is_active、isValid以及quota.remaining等兼容字段。 - 接口不会再暴露该用户全部权益,只会返回这把 Key 当前绑定、历史实际使用过,或在当前模型组范围内可访问的权益。
- 如果这把 Key 没有绑定单独权益,
current_entitlement会返回空值,但all_entitlements仍会返回这把 Key 可见范围内的权益。
curl
curl https://api.fastai.run/v1/usage \
-H "Authorization: Bearer YOUR_API_KEY"鉴权方式
所有请求需要在 HTTP Header 中携带 API Key,支持两种 Header 格式:
OpenAI 格式(推荐)
Authorization: Bearer YOUR_API_KEY
Content-Type: application/jsonAnthropic 格式(兼容)
x-api-key: YOUR_API_KEY
Content-Type: application/json常见错误码
| HTTP 状态码 | 说明 | 处理建议 |
|---|---|---|
| 401 | 未鉴权或 Key 无效 | 检查 API Key 是否正确且未过期 |
| 402 | 余额或配额不足 | 充值余额或升级套餐后重试 |
| 403 | 访问被拒绝 | 可能原因:账号被暂停、IP 不在白名单、套餐不含该模型 |
| 429 | 请求超出速率或并发限制 | 降低请求频率,等待 Retry-After 指示的秒数后重试 |
| 500 | 服务器内部错误 | 稍后重试,如持续出现请联系我们 |
| 502/503 | 上游服务暂时不可用 | 自动重试或切换模型 |
速率限制
不同套餐有不同的并发和速率限制。
- 免费套餐:2 并发、有限 Token 额度。
- 付费套餐:更高并发和更大 Token 额度。
- 请求超出限制时,API 会返回 429 状态码,并附带
Retry-After响应头,指示等待多少秒后可以重试。 - 具体套餐对比请查看 定价页面。