优先走各供应商原生聊天路由。
正在准备内容,请稍候。
正在切换页面...
网络较慢时会保留当前状态,直到新页面准备完成。
只写当前能稳定依赖的能力。
能依赖的写清;不能依赖的别写死。
优先走各供应商原生聊天路由。
`stream=true` 适合聊天、协作写作、实时反馈。
表单、工作流、JSON 回传优先用结构化输出。
长内容建议显式设置 `max_tokens`。
先分普通返回、流式、结构化输出。
一个偏系统对接,一个偏交互体验。
{
"model": "your_model_id_from_/v1/models",
"messages": [
{ "role": "system", "content": "请只返回 JSON。" },
{ "role": "user", "content": "输出一份包含 title 和 summary 的结果。" }
],
"response_format": {
"type": "json_object"
},
"temperature": 0.2
}{
"model": "your_model_id_from_/v1/models",
"messages": [
{ "role": "user", "content": "请分 3 条输出产品接入建议。" }
],
"stream": true,
"stream_options": {
"include_usage": true
}
}看 5 件事就够了:普通 JSON、SSE、multipart、二进制、备注。没写到的,不要默认支持。
| 路由 | JSON | 流式 | multipart | 二进制 | 备注 |
|---|---|---|---|---|---|
| OpenAI /v1/chat/completions | 是 | SSE | 否 | 否 | 主聊天路径。 |
| OpenAI /v1/responses | 是 | 增强兼容 | 否 | 否 | 已覆盖 created / delta / output_item / done / completed,但不是全事件面。 |
| OpenAI /v1/embeddings | 是 | 否 | 否 | 否 | 文本向量。 |
| OpenAI /v1/fine_tuning/jobs | 是 | 否 | 否 | 否 | 微调任务主路径。 |
| OpenAI /v1/moderations | 是 | 否 | 否 | 否 | 内容审核。 |
| OpenAI /v1/realtime/sessions | 是 | 否 | 否 | 否 | 只建 session,不代理 WS。 |
| OpenAI /v1/threads/runs | 是 | SSE | 否 | 否 | run create 已透传流式。 |
| OpenAI /v1/threads/{id}/runs/{run_id}/submit_tool_outputs | 是 | SSE | 否 | 否 | tool outputs 已透传流式。 |
| OpenAI /v1/files | 是 | 否 | 是 | 否 | 文件上传。 |
| OpenAI /v1/files/{id}/content | 否 | 否 | 否 | 是 | 原样下载文件内容。 |
| OpenAI /v1/uploads/* | 是 | 否 | parts | 否 | 分片上传链路。 |
| OpenAI /v1/images/generations | 是 | 否 | 否 | 否 | 图片生成主路径。 |
| OpenAI /v1/audio/speech | 否 | 否 | 否 | 是 | 返回音频二进制。 |
| OpenAI /v1/audio/transcriptions | 是 | 否 | 是 | 否 | 上传音频转写。 |
| OpenAI /v1/audio/translations | 是 | 否 | 是 | 否 | 上传音频翻译。 |
| Anthropic /v1/messages | 是 | SSE | 否 | 否 | Claude 原生消息。 |
| Anthropic /v1/messages/count_tokens | 是 | 否 | 否 | 否 | Claude token 统计。 |
| Anthropic /v1/messages/batches* | 是 | 否 | 否 | 结果下载 | Claude 批量消息对象族,含列表、创建、详情、取消与 results 下载。 |
| Anthropic /v1/files | 是 | 否 | 是 | 否 | Claude Files 列表与上传入口。 |
| Anthropic /v1/files/{id}/content | 否 | 否 | 否 | 是 | Claude Files 内容下载。 |
| OpenAI / Anthropic GET /v1/models/{id} | 是 | 否 | 否 | 否 | 模型详情查询。 |
| Gemini :generateContent | 是 | 否 | 否 | 否 | Gemini 普通生成。 |
| Gemini GET /v1beta/models/{model} | 是 | 否 | 否 | 否 | Gemini 模型详情。 |
| Gemini :streamGenerateContent | 是 | SSE | 否 | 否 | Gemini 流式生成。 |
| Gemini :countTokens | 是 | 否 | 否 | 否 | Gemini token 统计。 |
| Gemini :embedContent | 是 | 否 | 否 | 否 | Gemini 向量嵌入。 |
| Gemini :batchEmbedContents | 是 | 否 | 否 | 否 | Gemini 批量向量嵌入。 |
| Gemini /v1beta/files | 是 | 否 | 否 | 否 | Gemini 文件列表、metadata-only 创建、详情与删除。 |
| Gemini /upload/v1beta/files | start | 否 | 否 | 上传字节 | Gemini resumable 文件上传入口;start 会返回重写后的 relay upload url。 |
| Gemini /v1beta/cachedContents | 是 | 否 | 否 | 否 | Gemini context caching 列表与创建。 |
| Gemini /v1beta/cachedContents/{id} | 是 | 否 | 否 | 否 | Gemini context caching 详情、更新与删除。 |
| Gemini /v1beta/models/{model}:batchGenerateContent | 是 | 异步任务 | 否 | 否 | Gemini Batch API 创建入口,返回 `batches/*` 长任务。 |
| Gemini /v1beta/batches* | 是 | 否 | 否 | 否 | Gemini Batch API 列表、详情、取消与删除。 |
| Gemini /v1beta/tunedModels* | 是 | 否 | 否 | 否 | Gemini tunedModels 列表、创建、详情、更新、删除都已透传;但 Google 当前可能没有可 fine-tune 的 Gemini API 模型,真实可用性取决于上游。 |
| Qwen /compatible-mode/v1/chat/completions | 是 | SSE | 否 | 否 | DashScope 官方兼容接口,按官方 compatible-mode 迁移。 |
| Qwen /api/v1/services/aigc/text-generation/generation | 是 | SSE | 否 | 否 | DashScope 原生文本生成入口,支持 `incremental_output` 流式。 |
| Qwen /api/v1/services/embeddings/text-embedding/text-embedding | 是 | 否 | 否 | 否 | DashScope 原生文本嵌入。 |
| Qwen /api/v1/services/aigc/multimodal-generation/generation | 是 | SSE | 否 | 否 | DashScope 原生多模态生成,支持 `incremental_output` 流式。 |
| Qwen /api/v1/services/aigc/text2image/image-synthesis | 是 | 异步任务 | 否 | 否 | DashScope 原生图像生成任务创建;结果通过 `/api/v1/tasks/{task_id}` 查询,可通过 `/api/v1/tasks/{task_id}/cancel` 取消。 |
| Qwen /api/v1/tasks/{task_id}/cancel | 是 | 否 | 否 | 否 | DashScope 异步任务取消入口。 |
这部分不是在强调“我们没有”,而是在保护用户不要把未来可能变化的能力提前写死进生产系统。