API 概览

Fast AI API 的基本信息、Base URL、鉴权方式和支持的接口。

Base URL
所有 API 请求的统一入口。
鉴权
Bearer sk-fastai.run-...
标准 Bearer Token,在控制台创建 API Key。
协议兼容
OpenAI / Anthropic
同一把 Key 同时兼容两种 API 协议。

Base URL

所有 API 请求使用以下 Base URL:

提示
如果你之前使用 OpenAI 官方 API,只需将 Base URL 从 https://api.openai.com/v1 替换为上述地址,其他代码无需修改。
Base URL
https://api.fastai.run/v1

支持的接口

当前网关对外暴露以下 API 接口。

接口方法说明
/v1/chat/completionsPOSTOpenAI Chat Completions API(最常用)
/v1/completionsPOSTOpenAI Legacy Completions API
/v1/messagesPOSTAnthropic Messages API
/v1/responsesPOSTOpenAI Responses API
/v1/embeddingsPOST文本向量化
/v1/moderationsPOST内容审核
/v1/rerankPOST重排序
/v1/images/generationsPOST图像生成
/v1/images/editsPOST图像编辑
/v1/editsPOSTLegacy Edits 兼容接口
/v1/audio/speechPOST文本转语音
/v1/audio/transcriptionsPOST音频转写
/v1/audio/translationsPOST音频翻译
/v1/modelsGET获取当前 Key 可用模型列表
/v1/dashboard/billing/subscriptionGETOpenAI 兼容订阅/额度查询
/v1/dashboard/billing/usageGETOpenAI 兼容用量查询
/v1/usageGET查询当前 API Key、当前 Key 绑定/可达权益的用量视图

用量查询

可以直接使用 API Key 查询这把 Key 的近期使用情况,以及这把 Key 当前绑定、历史实际使用过或当前可访问的权益剩余额度。

  • 不需要额外登录态,只要带 API Key 即可。
  • 默认返回该 Key 最近 20 条请求记录,可通过 limit 参数指定 1-100 条。
  • 返回包含 api_keycurrent_entitlementall_entitlements 三个层级,适合 IDE skill、CLI 或自定义监控脚本直接消费。
  • 为了兼容 CC Switch / usage script,同时提供顶层 remainingunitbalanceis_activeisValid 以及 quota.remaining 等兼容字段。
  • 接口不会再暴露该用户全部权益,只会返回这把 Key 当前绑定、历史实际使用过,或在当前模型组范围内可访问的权益。
  • 如果这把 Key 没有绑定单独权益,current_entitlement 会返回空值,但 all_entitlements 仍会返回这把 Key 可见范围内的权益。
curl
curl https://api.fastai.run/v1/usage \
  -H "Authorization: Bearer YOUR_API_KEY"

鉴权方式

所有请求需要在 HTTP Header 中携带 API Key,支持两种 Header 格式:

OpenAI 格式(推荐)
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
Anthropic 格式(兼容)
x-api-key: YOUR_API_KEY
Content-Type: application/json

常见错误码

HTTP 状态码说明处理建议
401未鉴权或 Key 无效检查 API Key 是否正确且未过期
402余额或配额不足充值余额或升级套餐后重试
403访问被拒绝可能原因:账号被暂停、IP 不在白名单、套餐不含该模型
429请求超出速率或并发限制降低请求频率,等待 Retry-After 指示的秒数后重试
500服务器内部错误稍后重试,如持续出现请联系我们
502/503上游服务暂时不可用自动重试或切换模型

速率限制

不同套餐有不同的并发和速率限制。

  • 免费套餐:2 并发、有限 Token 额度。
  • 付费套餐:更高并发和更大 Token 额度。
  • 请求超出限制时,API 会返回 429 状态码,并附带 Retry-After 响应头,指示等待多少秒后可以重试。
  • 具体套餐对比请查看 定价页面