接入模式

常见接入模式集中说明。

这页只讲几类常见调用模式怎么组织请求、响应和降级。

查看 API Reference 查看 Realtime 方案

API 文档/接入模式

聊天应用

流式聊天重点是速度、稳定性和可追踪性。

重点看 SSE、服务端中转和会话状态。

优先启用 `stream=true`，让用户尽快看到内容开始返回。
前端先只保留会话态，真正请求仍然建议走你自己的服务端中转。
把模型名做成后端可切换配置，而不是写死在前端常量里。

聊天产品建议请求形态

const response = await fetch("/api/chat", {
  method: "POST",
  headers: { "Content-Type": "application/json" },
  body: JSON.stringify({
    model: "your_model_id_from_/v1/models",
    messages: [{ role: "user", content: input }],
    stream: true,
    stream_options: { include_usage: true }
  }),
});

内容生成

模板化生成重点是长度控制和日志留存。

批量生成时先控制模板、长度和重试。

这类场景通常对字数、语气、结构要求更高，建议显式设置 `max_tokens`。
如果需要审核和回看，保留调用日志和响应摘要会非常有价值。
不同内容模板可以复用同一个接口，只调整 prompt 模板和温度。

表单工作流

结构化工作流最重要的是结构稳定。

先保证字段可校验、格式固定、失败可兜底。

表单、工单、审批流更适合 `response_format.type=json_object`。
不要让下游系统依赖半结构化文本，统一回 JSON 再做字段校验。
低温度、短 prompt、严格字段约束通常更稳。

工作流 JSON 输出示例

{
  "model": "your_model_id_from_/v1/models",
  "messages": [
    { "role": "system", "content": "请严格返回 JSON。" },
    { "role": "user", "content": "提取标题、优先级和摘要。" }
  ],
  "response_format": { "type": "json_object" },
  "temperature": 0.2
}

客服机器人

支持类接入重点是降级、转人工和错误提示。

面向真实用户沟通时，应优先设计降级路径、知识来源边界和失败提示。

客服机器人优先关注稳定性和知识来源，而不是追求更花的文风。
建议把知识库召回、人工转接和敏感问题策略放在业务层处理。
出现 401 / 429 / 余额不足时，前台要有明确降级提示而不是空白失败。

接入模式

常见接入模式集中说明。

这页只讲几类常见调用模式怎么组织请求、响应和降级。

查看 API Reference 查看 Realtime 方案

API 文档/接入模式

聊天应用

流式聊天重点是速度、稳定性和可追踪性。

重点看 SSE、服务端中转和会话状态。

优先启用 `stream=true`，让用户尽快看到内容开始返回。
前端先只保留会话态，真正请求仍然建议走你自己的服务端中转。
把模型名做成后端可切换配置，而不是写死在前端常量里。

聊天产品建议请求形态

const response = await fetch("/api/chat", {
  method: "POST",
  headers: { "Content-Type": "application/json" },
  body: JSON.stringify({
    model: "your_model_id_from_/v1/models",
    messages: [{ role: "user", content: input }],
    stream: true,
    stream_options: { include_usage: true }
  }),
});

内容生成

模板化生成重点是长度控制和日志留存。

批量生成时先控制模板、长度和重试。

这类场景通常对字数、语气、结构要求更高，建议显式设置 `max_tokens`。
如果需要审核和回看，保留调用日志和响应摘要会非常有价值。
不同内容模板可以复用同一个接口，只调整 prompt 模板和温度。

表单工作流

结构化工作流最重要的是结构稳定。

先保证字段可校验、格式固定、失败可兜底。

表单、工单、审批流更适合 `response_format.type=json_object`。
不要让下游系统依赖半结构化文本，统一回 JSON 再做字段校验。
低温度、短 prompt、严格字段约束通常更稳。

工作流 JSON 输出示例

{
  "model": "your_model_id_from_/v1/models",
  "messages": [
    { "role": "system", "content": "请严格返回 JSON。" },
    { "role": "user", "content": "提取标题、优先级和摘要。" }
  ],
  "response_format": { "type": "json_object" },
  "temperature": 0.2
}

客服机器人

支持类接入重点是降级、转人工和错误提示。

面向真实用户沟通时，应优先设计降级路径、知识来源边界和失败提示。

客服机器人优先关注稳定性和知识来源，而不是追求更花的文风。
建议把知识库召回、人工转接和敏感问题策略放在业务层处理。
出现 401 / 429 / 余额不足时，前台要有明确降级提示而不是空白失败。

页面加载中

常见接入模式集中说明。

流式聊天重点是速度、稳定性和可追踪性。

模板化生成重点是长度控制和日志留存。

结构化工作流最重要的是结构稳定。

支持类接入重点是降级、转人工和错误提示。

常见接入模式集中说明。

流式聊天重点是速度、稳定性和可追踪性。

模板化生成重点是长度控制和日志留存。

结构化工作流最重要的是结构稳定。

支持类接入重点是降级、转人工和错误提示。