不是所有接口都能完全平替。高频主路径多数只要换 Base URL;更细对象族和事件面仍要看验收矩阵。
正在准备内容,请稍候。
正在切换页面...
网络较慢时会保留当前状态,直到新页面准备完成。
先看这页,再看 Reference。
不是所有接口都能完全平替。高频主路径多数只要换 Base URL;更细对象族和事件面仍要看验收矩阵。
主路径已打通。`compatible-mode/v1` 和原生 text generation、embedding、multimodal、image async 都可接。
主路径和常用子资源都已补齐;如果依赖最新细粒度事件,接入前仍建议联调。
通常填 `https://tokenapi.bytrabbit.com/v1` 给 OpenAI SDK;如果是手写 HTTP,也可以用 `https://tokenapi.bytrabbit.com` 再自己请求 `/v1/...`。
通常填 `https://tokenapi.bytrabbit.com`,消息请求走 `/v1/messages`,文件请求走 `/v1/files`。如果客户端要求完整地址,就填对应完整路径。
填 `https://tokenapi.bytrabbit.com`。生成、嵌入、文件、缓存、批处理、tunedModels 都走原生 `/v1beta/*` 和 `/upload/v1beta/files`。Gemini Live 走独立 `gemini-live-relay`。
compatible-mode 填 `https://tokenapi.bytrabbit.com/compatible-mode/v1`。原生接口填 `https://tokenapi.bytrabbit.com` 再请求 `/api/v1/...`。图像异步任务走 `/api/v1/tasks/{task_id}`。
因为 token 绑定的供应商和你访问的原生路由不一致。
因为 `/v1/chat/completions` 属于 OpenAI。Claude 要走 `/v1/messages`。
先读 `Retry-After` 和剩余额度头,再退避重试。
OpenAI `chat/completions`、`threads/runs`、`submit_tool_outputs`,Anthropic `/v1/messages`,Gemini `:streamGenerateContent`,Qwen compatible-mode 和原生 text/multimodal 都支持。
可以。绑定 Anthropic 渠道的 token 访问 `/v1/files`、`/v1/files/{id}`、`/v1/files/{id}/content` 时,会走 Anthropic Files API。
先 `POST /v1/files` 拿到 `file_id`,再在 `/v1/messages` 里按 Anthropic 原生格式引用。
因为那是 SSE,不是普通 JSON。客户端要逐块读,到 `[DONE]` 结束。
主站负责 `POST /v1/realtime/sessions` 创建 session;HTTP baseUrl 不用改。若已部署独立 `realtime-relay`,响应头会返回 `x-tokenai-realtime-relay-url`,支持自动发现 WebSocket 地址。
因为 WebSocket 已拆到独立 relay 进程,主站只做 session 创建。
单独起 relay 服务,不要塞进当前 Route Handlers。