跳转到主要内容
/v1/embeddings 端点将一个或多个文本字符串转换为稠密向量表示(embedding)。你可以用这些向量进行语义相似度搜索、构建 RAG 流程、聚类文档或训练分类器。OpenOpen8 兼容 OpenAI Embeddings API 格式,任何 OpenAI 兼容的 embedding 客户端无需修改即可使用。

POST /v1/embeddings

请求体

model
string
必填
embedding 模型,例如 text-embedding-3-smalltext-embedding-3-largetext-embedding-ada-002。可用模型取决于你配置的渠道。
input
string | string[]
必填
要向量化的文本。可以是单个字符串或字符串数组。每个字符串独立向量化。数组适合在一次请求中批量处理多个文档。
encoding_format
string
返回的向量格式。float 返回浮点数数组;base64 返回 base64 编码的二进制字符串。默认 float
dimensions
integer
输出向量的维度数。仅部分模型支持(如 text-embedding-3-smalltext-embedding-3-large)。将向量截断到指定长度。
user
string
终端用户的可选标识符。用于服务商侧的监控和滥用检测。

响应

object
string
始终为 "list"
model
string
生成 embedding 的模型。
data
object[]
embedding 对象数组,每个输入字符串对应一个。
usage
object
请求的 token 用量。

示例

curl https://openopen8.ai/v1/embeddings \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": [
      "OpenOpen8 is a unified AI gateway.",
      "You can embed multiple strings in one request."
    ],
    "encoding_format": "float"
  }'

常见用途

  • 语义搜索 — 向量化文档库和用户查询,按余弦相似度排序。
  • 检索增强生成(RAG) — 在传递给语言模型前检索知识库中最相关的片段。
  • 聚类 — 无需标注数据即可将语义相关的文档分组。
  • 分类 — 将向量作为下游分类器的特征。