/v1/rerank 端点接收一个查询字符串和一组候选文档,按与查询的相关性排序后返回。重排序通常用于快速初始检索后的二次过滤——例如在 RAG 流程中进行向量相似度搜索后——以提升传递给语言模型的结果质量。
OpenOpen8 的重排序端点同时兼容 Cohere Rerank API 格式和 Jina Rerank API 格式。
POST /v1/rerank
请求体
重排序模型,例如
rerank-english-v3.0(Cohere)或 jina-reranker-v2-base-multilingual(Jina)。可用模型取决于你配置的渠道。用于对文档排序的搜索查询。
要排序的文档列表。每个元素可以是字符串,或包含
text 字段的对象。返回的最高排名结果数。省略时返回所有文档,按相关性分数排序。
设为
true 时,每个结果除索引和相关性分数外还包含原始文档文本。默认 false。服务商内部拆分长文档时每个文档的最大分块数。
服务商拆分长文档时分块之间的重叠 token 数。
响应
排序后的文档结果列表,从最相关到最不相关。
请求的 token 用量。
示例
响应示例
支持的服务商
| 服务商 | 示例模型 |
|---|---|
| Cohere | rerank-english-v3.0、rerank-multilingual-v3.0 |
| Jina | jina-reranker-v2-base-multilingual、jina-reranker-v1-base-en |