POST /v1/rerank

/v1/rerank 端点接收一个查询字符串和一组候选文档，按与查询的相关性排序后返回。重排序通常用于快速初始检索后的二次过滤——例如在 RAG 流程中进行向量相似度搜索后——以提升传递给语言模型的结果质量。 OpenOpen8 的重排序端点同时兼容 Cohere Rerank API 格式和 Jina Rerank API 格式。

请求体

model

string

必填

重排序模型，例如 rerank-english-v3.0（Cohere）或 jina-reranker-v2-base-multilingual（Jina）。可用模型取决于你配置的渠道。

query

string

必填

用于对文档排序的搜索查询。

documents

string[] | object[]

必填

要排序的文档列表。每个元素可以是字符串，或包含 text 字段的对象。

top_n

integer

返回的最高排名结果数。省略时返回所有文档，按相关性分数排序。

return_documents

boolean

设为 true 时，每个结果除索引和相关性分数外还包含原始文档文本。默认 false。

max_chunk_per_doc

integer

服务商内部拆分长文档时每个文档的最大分块数。

overlap_tokens

integer

服务商拆分长文档时分块之间的重叠 token 数。

响应

results

object[]

排序后的文档结果列表，从最相关到最不相关。

显示 result 对象属性

index

integer

该文档在原始 documents 数组中的零基索引。

relevance_score

number

0.0 到 1.0 之间的分数，表示文档与查询的相关程度。越高越相关。

document

object

原始文档，仅在 return_documents 为 true 时出现。

显示 document 属性

text

string

文档文本。

usage

object

请求的 token 用量。

显示 usage 属性

prompt_tokens

integer

查询和文档消耗的 token 数。

total_tokens

integer

处理的总 token 数。

示例

curl https://openopen8.ai/v1/rerank \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "rerank-english-v3.0",
    "query": "What is the capital of France?",
    "documents": [
      "Paris is the capital and largest city of France.",
      "The Eiffel Tower is located in Paris.",
      "Berlin is the capital of Germany.",
      "France has a population of over 67 million."
    ],
    "top_n": 2,
    "return_documents": true
  }'

响应示例

{
  "results": [
    {
      "index": 0,
      "relevance_score": 0.9921,
      "document": { "text": "Paris is the capital and largest city of France." }
    },
    {
      "index": 1,
      "relevance_score": 0.4103,
      "document": { "text": "The Eiffel Tower is located in Paris." }
    }
  ],
  "usage": {
    "prompt_tokens": 62,
    "total_tokens": 62
  }
}

支持的服务商

服务商	示例模型
Cohere	`rerank-english-v3.0`、`rerank-multilingual-v3.0`
Jina	`jina-reranker-v2-base-multilingual`、`jina-reranker-v1-base-en`

概览

对话与补全

媒体与多模态

其他端点

POST /v1/rerank — 文档重排序

POST /v1/rerank

请求体

响应

示例

响应示例

支持的服务商

概览

对话与补全

媒体与多模态

其他端点

​POST /v1/rerank

​请求体

​响应

​示例

​响应示例

​支持的服务商

POST /v1/rerank

请求体

响应

示例

响应示例

支持的服务商