错误码与状态码

把失败怎么返回、客户端该怎么处理讲清楚，接入方才敢真的上线。

对接入方来说，最怕的不是报错，而是“报错了但不知道该不该重试、该看哪里、该修哪一层”。这页把错误结构、状态码、限流头和重试边界拆开说明。

API 文档/错误码与状态码

错误结构

客户端首先要能稳定读取错误结构，而不是靠字符串猜问题。

建议优先读取 `error.message`、`error.type` 和 `error.code`。对生产系统来说，`status code + error.code` 的组合比单看提示文案更可靠。

标准错误响应结构

{
  "error": {
    "message": "Rate limit exceeded for this token window.",
    "type": "rate_limit_error",
    "code": "rate_limit_exceeded"
  }
}

429 限流头示例

HTTP/1.1 429 Too Many Requests
Content-Type: application/json
Retry-After: 30
X-RateLimit-Limit-Minute: 60
X-RateLimit-Remaining-Minute: 0
X-RateLimit-Reset-Minute: 1712395230
X-RateLimit-Limit-Hour: 1000
X-RateLimit-Remaining-Hour: 824

状态码

先分清是“请求错了”、 “权限错了”还是“稍后再试”。

状态码不是为了装饰响应，而是帮助客户端快速决定下一步动作：修请求、换令牌、等待、还是进入告警流程。

400 Bad Request

请求体结构不符合当前公开协议，或传入了当前未覆盖的字段组合。
优先回到该供应商的最小可用请求体，确认后再逐步加参数。

401 Unauthorized / 403 Forbidden

通常是 Bearer 令牌缺失、无效、已停用，或当前令牌没有该模型权限。
先检查 Authorization 头，再确认模型名和路由跟供应商一致。

429 Too Many Requests

命中了分钟或小时级限流，不代表网关不可用，更不该无间隔重试。
客户端应读取 `Retry-After` 和限流头，做退避重试或前端友好提示。

5xx Upstream / Gateway Errors

可能来自上游模型服务、渠道异常或临时网络问题。
短时间偶发失败适合指数退避；持续失败应查看日志、渠道状态和网关监控。

限流响应头

收到 429 时，最值得看的不是报错文案，而是响应头。

分钟和小时窗口的剩余额度、重置时间、`Retry-After` 都应该被客户端显式消费，而不是丢掉不用。

`Retry-After`：告诉客户端至少多久后再试，适合直接控制退避等待。
`X-RateLimit-Limit-*`：说明当前窗口总额度，适合做后台观测和配额展示。
`X-RateLimit-Remaining-*`：说明当前窗口剩余额度，适合提前降级而不是等到硬性报错。
`X-RateLimit-Reset-*`：说明窗口何时重置，适合前端做倒计时或服务端做调度。

重试策略

重试不是默认动作，只有部分错误值得带退避重试。

真正稳的客户端，不是“失败了就重试”，而是知道哪些错误该停下来修，哪些错误才应该等待后再试。

应该立即停止并修请求

`400` 这类请求格式错误不要盲重试，先修模型名、messages 或参数结构。
`401 / 403` 先修令牌、权限和环境配置，而不是换一个重试循环。

适合带退避重试

`429`、网络抖动、上游超时、短时 `5xx` 适合做指数退避。
建议限制最大重试次数，并把最终失败记录到业务日志或错误监控。

流式请求的特殊点

SSE 中途断开时，不要直接把半截内容当作完整成功响应写入业务系统。
如果业务要求强一致，建议先落库请求上下文，再按需重试或回退到非流式模式。

带退避的服务端重试示例

async function requestWithBackoff(payload, attempt = 0) {
  const response = await fetch("https://api.ciyuan.com/v1/messages", {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: `Bearer ${process.env.TOKENAI_API_KEY}`,
    },
    body: JSON.stringify(payload),
  });

  if (response.ok) {
    return response.json();
  }

  if (![429, 500, 502, 503, 504].includes(response.status) || attempt >= 3) {
    throw new Error(`request failed: ${response.status}`);
  }

  const retryAfter = Number(response.headers.get("Retry-After") ?? 0);
  const delayMs = retryAfter > 0 ? retryAfter * 1000 : 1000 * 2 ** attempt;
  await new Promise((resolve) => setTimeout(resolve, delayMs));

  return requestWithBackoff(payload, attempt + 1);
}

错误码与状态码

把失败怎么返回、客户端该怎么处理讲清楚，接入方才敢真的上线。

查看接口参考查看排错手册

API 文档/错误码与状态码

错误结构

客户端首先要能稳定读取错误结构，而不是靠字符串猜问题。

建议优先读取 `error.message`、`error.type` 和 `error.code`。对生产系统来说，`status code + error.code` 的组合比单看提示文案更可靠。

标准错误响应结构

{
  "error": {
    "message": "Rate limit exceeded for this token window.",
    "type": "rate_limit_error",
    "code": "rate_limit_exceeded"
  }
}

429 限流头示例

HTTP/1.1 429 Too Many Requests
Content-Type: application/json
Retry-After: 30
X-RateLimit-Limit-Minute: 60
X-RateLimit-Remaining-Minute: 0
X-RateLimit-Reset-Minute: 1712395230
X-RateLimit-Limit-Hour: 1000
X-RateLimit-Remaining-Hour: 824

状态码

先分清是“请求错了”、 “权限错了”还是“稍后再试”。

状态码不是为了装饰响应，而是帮助客户端快速决定下一步动作：修请求、换令牌、等待、还是进入告警流程。

400 Bad Request

请求体结构不符合当前公开协议，或传入了当前未覆盖的字段组合。
优先回到该供应商的最小可用请求体，确认后再逐步加参数。

401 Unauthorized / 403 Forbidden

通常是 Bearer 令牌缺失、无效、已停用，或当前令牌没有该模型权限。
先检查 Authorization 头，再确认模型名和路由跟供应商一致。

429 Too Many Requests

命中了分钟或小时级限流，不代表网关不可用，更不该无间隔重试。
客户端应读取 `Retry-After` 和限流头，做退避重试或前端友好提示。

5xx Upstream / Gateway Errors

可能来自上游模型服务、渠道异常或临时网络问题。
短时间偶发失败适合指数退避；持续失败应查看日志、渠道状态和网关监控。

限流响应头

收到 429 时，最值得看的不是报错文案，而是响应头。

分钟和小时窗口的剩余额度、重置时间、`Retry-After` 都应该被客户端显式消费，而不是丢掉不用。

`Retry-After`：告诉客户端至少多久后再试，适合直接控制退避等待。
`X-RateLimit-Limit-*`：说明当前窗口总额度，适合做后台观测和配额展示。
`X-RateLimit-Remaining-*`：说明当前窗口剩余额度，适合提前降级而不是等到硬性报错。
`X-RateLimit-Reset-*`：说明窗口何时重置，适合前端做倒计时或服务端做调度。

重试策略

重试不是默认动作，只有部分错误值得带退避重试。

真正稳的客户端，不是“失败了就重试”，而是知道哪些错误该停下来修，哪些错误才应该等待后再试。

应该立即停止并修请求

`400` 这类请求格式错误不要盲重试，先修模型名、messages 或参数结构。
`401 / 403` 先修令牌、权限和环境配置，而不是换一个重试循环。

适合带退避重试

`429`、网络抖动、上游超时、短时 `5xx` 适合做指数退避。
建议限制最大重试次数，并把最终失败记录到业务日志或错误监控。

流式请求的特殊点

SSE 中途断开时，不要直接把半截内容当作完整成功响应写入业务系统。
如果业务要求强一致，建议先落库请求上下文，再按需重试或回退到非流式模式。

带退避的服务端重试示例

async function requestWithBackoff(payload, attempt = 0) {
  const response = await fetch("https://api.ciyuan.com/v1/messages", {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: `Bearer ${process.env.TOKENAI_API_KEY}`,
    },
    body: JSON.stringify(payload),
  });

  if (response.ok) {
    return response.json();
  }

  if (![429, 500, 502, 503, 504].includes(response.status) || attempt >= 3) {
    throw new Error(`request failed: ${response.status}`);
  }

  const retryAfter = Number(response.headers.get("Retry-After") ?? 0);
  const delayMs = retryAfter > 0 ? retryAfter * 1000 : 1000 * 2 ** attempt;
  await new Promise((resolve) => setTimeout(resolve, delayMs));

  return requestWithBackoff(payload, attempt + 1);
}

页面加载中

把失败怎么返回、客户端该怎么处理讲清楚，接入方才敢真的上线。

客户端首先要能稳定读取错误结构，而不是靠字符串猜问题。

先分清是“请求错了”、 “权限错了”还是“稍后再试”。

收到 429 时，最值得看的不是报错文案，而是响应头。

重试不是默认动作，只有部分错误值得带退避重试。

把失败怎么返回、客户端该怎么处理讲清楚，接入方才敢真的上线。

客户端首先要能稳定读取错误结构，而不是靠字符串猜问题。

先分清是“请求错了”、 “权限错了”还是“稍后再试”。

收到 429 时，最值得看的不是报错文案，而是响应头。

重试不是默认动作，只有部分错误值得带退避重试。