POST /v1/chat/completions — OpenAI 对话格式

/v1/chat/completions 端点接收一组消息并返回模型的回复。OpenOpen8 完全实现了 OpenAI Chat Completions 格式，你只需修改 base URL 和 API key，就能将任何现有的 OpenAI SDK 或客户端指向 OpenOpen8，无需其他代码改动。

端点

POST /v1/chat/completions

认证

在 Authorization 头中传入你的 OpenOpen8 token：

Authorization: Bearer YOUR_TOKEN

请求参数

model

string

必填

用于生成补全的模型标识符。OpenOpen8 会将请求路由到该模型对应的上游渠道。对于 OpenAI o 系列推理模型，可使用后缀变体控制推理强度：o3-mini-high、o3-mini-medium 或 o3-mini-low，分别对应 reasoning_effort 的 high、medium 和 low。

messages

object[]

必填

按顺序排列的消息数组，表示对话历史。每条消息必须包含 role 和 content。

显示消息属性

messages[].role

string

必填

消息作者的角色。可选值：system、user、assistant 或 tool。对于较新的 OpenAI 推理模型（o3 及更高、gpt-5 及更高），请用 developer 代替 system。

messages[].content

string | object[]

必填

消息内容。纯文本消息传字符串，多模态消息（文本、图片、音频、文件）传内容块数组。

messages[].name

string

参与者名称（可选）。同一角色多次出现时有助于区分。

messages[].tool_calls

object[]

模型在上一轮生成的 tool calling 请求。仅出现在调用了工具的 assistant 消息中。

messages[].tool_call_id

string

此消息所回应的 tool call ID。tool 角色的消息必填。

stream

boolean

默认值:"false"

设为 true 时，响应以 SSE（服务端推送事件）流式返回。每个事件包含一个 ChatCompletionChunk 部分对象。流以 data: [DONE] 结束。

stream_options

object

仅在 stream 为 true 时生效的选项。

显示 stream_options 属性

stream_options.include_usage

boolean

默认值:"false"

设为 true 时，最后一个 SSE 块中包含 usage 字段（token 用量统计）。

temperature

number

采样温度，范围 0 到 2。值越高输出越随机，值越低输出越确定。与 top_p 互斥——只用其中一个。

top_p

number

核采样概率质量。模型只考虑累积概率达到 top_p 的 token。取值 0 到 1。与 temperature 互斥。

max_tokens

integer

模型可生成的最大 token 数量。未指定时使用模型默认限制。较新的 OpenAI 模型请用 max_completion_tokens。

max_completion_tokens

integer

补全中可生成的最大 token 数量，包含推理 token。同时提供时优先于 max_tokens。

reasoning_effort

string

控制模型在回复前的推理程度。可选值：low、medium、high。适用于 OpenAI 推理模型（o 系列）。也可直接在模型名中编码推理强度：o3-mini-high、o3-mini-medium、o3-mini-low。

stop

string | string[]

一个或多个停止序列。模型遇到这些序列时停止生成，输出中不包含停止序列本身。

integer

默认值:"1"

为每条消息生成多少个补全选项。

frequency_penalty

number

默认值:"0"

取值 -2.0 到 2.0。正值会惩罚在已有文本中频繁出现的 token，减少重复。

presence_penalty

number

默认值:"0"

取值 -2.0 到 2.0。正值会惩罚在已有文本中出现过的 token，增加话题多样性。

seed

integer

设置后模型尝试产生确定性输出。不保证跨模型版本的可重复性。

logprobs

boolean

默认值:"false"

是否返回输出 token 的对数概率。

top_logprobs

integer

在每个 token 位置返回最可能的 token 数量及其对数概率。需要 logprobs 为 true。取值 0 到 20。

tools

object[]

模型可调用的工具列表。每个工具定义一个模型可调用的函数。

显示工具属性

tools[].type

string

必填

工具类型。目前仅支持 "function"。

tools[].function

object

必填

函数定义。

显示函数属性

tools[].function.name

string

必填

要调用的函数名。

tools[].function.description

string

函数功能描述。模型根据此描述决定何时调用。

tools[].function.parameters

object

函数参数，JSON Schema 格式。

tool_choice

string | object

默认值:"auto"

控制模型如何选择工具。传 "none" 禁用 tool calling，"auto" 由模型决定，"required" 强制调用工具，或传对象 {"type": "function", "function": {"name": "..."}} 强制调用指定函数。

parallel_tool_calls

boolean

默认值:"true"

是否允许模型在单轮中调用多个工具。

response_format

object

指定输出格式。传 {"type": "json_object"} 启用 JSON 模式。传 {"type": "json_schema", "json_schema": {...}} 强制遵循指定的 JSON Schema。

显示 response_format 属性

response_format.type

string

必填

输出格式。可选 "text"、"json_object" 或 "json_schema"。

response_format.json_schema

object

当 type 为 "json_schema" 时必填。定义输出必须遵循的 schema。

响应字段

string

此次补全的唯一标识符，格式为 chatcmpl-...。

object

string

非流式响应始终为 "chat.completion"，流式块为 "chat.completion.chunk"。

created

integer

补全创建时间的 Unix 时间戳（秒）。

model

string

生成此补全所用的模型标识符。

choices

object[]

补全选项数组。大多数请求返回一个选项（n=1）。

显示 choice 属性

choices[].index

integer

此选项的索引，从 0 开始。

choices[].message

object

生成的消息。

显示消息属性

choices[].message.role

string

生成消息的角色，始终为 "assistant"。

choices[].message.content

string | null

消息的文本内容。当模型调用工具而非生成文本时为 null。

choices[].message.tool_calls

object[]

模型请求的 tool calling（如有）。每项包含 id、type 和 function（含 name 和 arguments）。

choices[].message.reasoning_content

string

模型的内部推理内容（上游返回时可见，如支持思考的模型）。

choices[].finish_reason

string

模型停止生成的原因。可选值："stop"（自然结束）、"length"（达到 token 限制）、"tool_calls"（调用了工具）或 "content_filter"（内容过滤）。

usage

object

此次请求的 token 用量统计。

显示 usage 属性

usage.prompt_tokens

integer

输入消息中的 token 数量。

usage.completion_tokens

integer

生成输出中的 token 数量。

usage.total_tokens

integer

prompt_tokens 与 completion_tokens 之和。

示例

非流式
流式

curl https://openopen8.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "What is the capital of France?"}
    ]
  }'

响应示例：

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1714000000,
  "model": "gpt-4o",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The capital of France is Paris."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 9,
    "total_tokens": 34
  }
}

curl https://openopen8.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "stream": true,
    "stream_options": {"include_usage": true},
    "messages": [
      {"role": "user", "content": "Tell me a short joke."}
    ]
  }'

服务端以如下格式发送事件。每行以 data: 开头，后接 JSON 对象：

data: {"id":"chatcmpl-abc123","object":"chat.completion.chunk","created":1714000000,"model":"gpt-4o","choices":[{"index":0,"delta":{"role":"assistant","content":"Why"},"finish_reason":null}]}

data: {"id":"chatcmpl-abc123","object":"chat.completion.chunk","created":1714000000,"model":"gpt-4o","choices":[{"index":0,"delta":{"content":" don't"},"finish_reason":null}]}

data: [DONE]

推理模型

使用 OpenAI 推理模型时，将 model 设为 o 系列标识符。可通过 reasoning_effort 参数或直接在模型名中编码来控制推理强度：

{"model": "o3-mini-high", "messages": [...]}

等价于：

{"model": "o3-mini", "reasoning_effort": "high", "messages": [...]}

Claude 的思考模式使用 -thinking 后缀模型名——例如 claude-3-7-sonnet-20250219-thinking。Gemini 思考模式在模型名后追加 -thinking，或使用 -low、-medium、-high 控制推理强度。

概览

对话与补全

媒体与多模态

其他端点

POST /v1/chat/completions — OpenAI 对话格式

端点

认证

请求参数

响应字段

示例

推理模型

概览

对话与补全

媒体与多模态

其他端点

​端点

​认证

​请求参数

​响应字段

​示例

​推理模型

端点

认证

请求参数

响应字段

示例

推理模型