跳转到主要内容
为保障服务稳定性,OpenOpen8 对 API 请求有频率限制。

限制规则

  • 每个 token 有每分钟请求次数限制
  • 不同模型可能有不同的频率限制
  • 超过限制会收到 429 Too Many Requests 错误

遇到限速怎么办

收到 429 错误时:
{
  "error": {
    "message": "Rate limit exceeded",
    "type": "rate_limit_error",
    "code": "rate_limit_exceeded"
  }
}
处理方式:
  1. 等一下再试 — 响应头 Retry-After 会告诉你等几秒
  2. 加指数退避 — 每次重试间隔翻倍(1s → 2s → 4s → 8s)
  3. 控制并发 — 减少同时发出的请求数量
import time
import openai

def call_with_retry(client, max_retries=3, **kwargs):
    for i in range(max_retries):
        try:
            return client.chat.completions.create(**kwargs)
        except openai.RateLimitError:
            wait = 2 ** i  # 指数退避
            time.sleep(wait)
    raise Exception("重试次数用尽")

提高限额

如果默认限额不够用,可以:
  • 充值更多额度(余额越高,限额通常越宽松)
  • 联系客服申请提高限额
合理的做法是在客户端实现重试逻辑,而不是假设请求永远不会被限速。