/v1/embeddings 端点将一个或多个文本字符串转换为稠密向量表示(embedding)。你可以用这些向量进行语义相似度搜索、构建 RAG 流程、聚类文档或训练分类器。OpenOpen8 兼容 OpenAI Embeddings API 格式,任何 OpenAI 兼容的 embedding 客户端无需修改即可使用。
POST /v1/embeddings
请求体
embedding 模型,例如
text-embedding-3-small、text-embedding-3-large 或 text-embedding-ada-002。可用模型取决于你配置的渠道。要向量化的文本。可以是单个字符串或字符串数组。每个字符串独立向量化。数组适合在一次请求中批量处理多个文档。
返回的向量格式。
float 返回浮点数数组;base64 返回 base64 编码的二进制字符串。默认 float。输出向量的维度数。仅部分模型支持(如
text-embedding-3-small 和 text-embedding-3-large)。将向量截断到指定长度。终端用户的可选标识符。用于服务商侧的监控和滥用检测。
响应
始终为
"list"。生成 embedding 的模型。
embedding 对象数组,每个输入字符串对应一个。
请求的 token 用量。
示例
常见用途
- 语义搜索 — 向量化文档库和用户查询,按余弦相似度排序。
- 检索增强生成(RAG) — 在传递给语言模型前检索知识库中最相关的片段。
- 聚类 — 无需标注数据即可将语义相关的文档分组。
- 分类 — 将向量作为下游分类器的特征。