托管 API 提供商

本页覆盖需要 API Key、并通过 LibreFang 原生 Anthropic/Gemini 驱动或共享 OpenAI-compatible 驱动接入的云端模型提供商。

包含的提供商

  • Anthropic
  • OpenAI
  • Google Gemini
  • DeepSeek
  • Groq
  • OpenRouter
  • Mistral AI
  • Together AI
  • Fireworks AI
  • Perplexity AI
  • Cohere
  • Cerebras
  • SambaNova
  • Hugging Face
  • xAI
  • Alibaba Coding Plan
  • Moonshot (Kimi)
  • Novita AI
  • AWS Bedrock

Anthropic

显示名称Anthropic
驱动原生 Anthropic (Messages API)
环境变量ANTHROPIC_API_KEY
基础 URLhttps://api.anthropic.com
需要密钥
免费额度
认证方式x-api-key 请求头
模型数7

可用模型:

  • claude-opus-4-20250514 (旗舰)
  • claude-sonnet-4-20250514 (智能)
  • claude-haiku-4-5-20251001 (快速)

设置:

  1. console.anthropic.com 注册账号
  2. 在 Settings > API Keys 下创建 API 密钥
  3. export ANTHROPIC_API_KEY="sk-ant-..."

OpenAI

显示名称OpenAI
驱动OpenAI 兼容
环境变量OPENAI_API_KEY
基础 URLhttps://api.openai.com/v1
需要密钥
免费额度
认证方式Authorization: Bearer 请求头
模型数18

可用模型:

  • gpt-4.1 (旗舰)
  • gpt-4o (智能)
  • o3-mini (智能)
  • gpt-4.1-mini (平衡)
  • gpt-4o-mini (快速)
  • gpt-4.1-nano (快速)

设置:

  1. platform.openai.com 注册账号
  2. 在 API Keys 下创建 API 密钥
  3. export OPENAI_API_KEY="sk-..."

Google Gemini

显示名称Google Gemini
驱动原生 Gemini (generateContent API)
环境变量GEMINI_API_KEY(或 GOOGLE_API_KEY
基础 URLhttps://generativelanguage.googleapis.com
需要密钥
免费额度有(免费额度充裕)
认证方式x-goog-api-key 请求头
模型数10

可用模型:

  • gemini-2.5-pro (旗舰)
  • gemini-2.5-flash (智能)
  • gemini-2.0-flash (快速)

设置:

  1. 前往 aistudio.google.com
  2. 获取 API 密钥(含免费额度)
  3. export GEMINI_API_KEY="AIza..."export GOOGLE_API_KEY="AIza..."

说明: Gemini 驱动是完全原生的实现,不是 OpenAI 兼容的。模型通过 URL 路径指定,系统提示通过 systemInstruction 传递,工具通过 functionDeclarations 传递,流式传输通过 streamGenerateContent?alt=sse 实现。


DeepSeek

显示名称DeepSeek
驱动OpenAI 兼容
环境变量DEEPSEEK_API_KEY
基础 URLhttps://api.deepseek.com/v1
需要密钥
免费额度
认证方式Authorization: Bearer 请求头
模型数4

可用模型:

  • deepseek-chat (智能) -- DeepSeek V3
  • deepseek-reasoner (智能) -- DeepSeek R1,不支持工具调用

设置:

  1. platform.deepseek.com 注册账号
  2. 创建 API 密钥
  3. export DEEPSEEK_API_KEY="sk-..."

Groq

显示名称Groq
驱动OpenAI 兼容
环境变量GROQ_API_KEY
基础 URLhttps://api.groq.com/openai/v1
需要密钥
免费额度有(有速率限制)
认证方式Authorization: Bearer 请求头
模型数10

可用模型:

  • llama-3.3-70b-versatile (平衡)
  • mixtral-8x7b-32768 (平衡)
  • llama-3.1-8b-instant (快速)
  • gemma2-9b-it (快速)

设置:

  1. console.groq.com 注册账号
  2. 创建 API 密钥
  3. export GROQ_API_KEY="gsk_..."

说明: Groq 在自研的 LPU 硬件上运行开源模型,推理速度极快。免费额度有速率限制,但完全可用。


OpenRouter

显示名称OpenRouter
驱动OpenAI 兼容
环境变量OPENROUTER_API_KEY
基础 URLhttps://openrouter.ai/api/v1
需要密钥
免费额度有(8 个免费模型,包括 Step 3.5 Flash、DeepSeek R1、Llama 3.1 8B 等)
认证方式Authorization: Bearer 请求头
模型数17

可用模型:

  • openrouter/google/gemini-2.5-flash (智能) -- 便宜、快速、100 万上下文(默认)
  • openrouter/anthropic/claude-sonnet-4 (智能) -- 强推理 + 工具调用
  • openrouter/openai/gpt-4o (智能) -- 通过 OpenRouter 使用 GPT-4o
  • openrouter/deepseek/deepseek-chat (智能) -- DeepSeek V3
  • openrouter/meta-llama/llama-3.3-70b-instruct (平衡) -- Llama 3.3 70B
  • openrouter/qwen/qwen-2.5-72b-instruct (平衡) -- Qwen 2.5 72B
  • openrouter/google/gemini-2.5-pro (旗舰) -- Gemini 2.5 Pro
  • openrouter/mistralai/mistral-large-latest (智能) -- Mistral Large
  • openrouter/google/gemma-2-9b-it (快速) -- Gemma 2 9B,免费
  • openrouter/deepseek/deepseek-r1 (旗舰) -- DeepSeek R1 推理

设置:

  1. openrouter.ai 注册账号
  2. 在 Keys 下创建 API 密钥
  3. export OPENROUTER_API_KEY="sk-or-..."

说明: OpenRouter 是一个统一的网关,可访问来自多个提供商的 200+ 个模型。模型 ID 使用上游格式(如 google/gemini-2.5-flash)。你可以通过指定带 openrouter/ 前缀的完整模型路径来使用 OpenRouter 目录中的任何模型。


Mistral AI

显示名称Mistral AI
驱动OpenAI 兼容
环境变量MISTRAL_API_KEY
基础 URLhttps://api.mistral.ai/v1
需要密钥
免费额度
认证方式Authorization: Bearer 请求头
模型数6

可用模型:

  • mistral-large-latest (智能)
  • codestral-latest (智能)
  • mistral-small-latest (快速)

设置:

  1. console.mistral.ai 注册账号
  2. 创建 API 密钥
  3. export MISTRAL_API_KEY="..."

Together AI

显示名称Together AI
驱动OpenAI 兼容
环境变量TOGETHER_API_KEY
基础 URLhttps://api.together.xyz/v1
需要密钥
免费额度有(注册赠送有限额度)
认证方式Authorization: Bearer 请求头
模型数8

可用模型:

  • meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo (旗舰)
  • Qwen/Qwen2.5-72B-Instruct-Turbo (智能)
  • mistralai/Mixtral-8x22B-Instruct-v0.1 (平衡)

设置:

  1. api.together.ai 注册账号
  2. 创建 API 密钥
  3. export TOGETHER_API_KEY="..."

Fireworks AI

显示名称Fireworks AI
驱动OpenAI 兼容
环境变量FIREWORKS_API_KEY
基础 URLhttps://api.fireworks.ai/inference/v1
需要密钥
免费额度有(注册赠送有限额度)
认证方式Authorization: Bearer 请求头
模型数5

可用模型:

  • accounts/fireworks/models/llama-v3p1-405b-instruct (旗舰)
  • accounts/fireworks/models/mixtral-8x22b-instruct (平衡)

设置:

  1. fireworks.ai 注册账号
  2. 创建 API 密钥
  3. export FIREWORKS_API_KEY="..."

Perplexity AI

显示名称Perplexity AI
驱动OpenAI 兼容
环境变量PERPLEXITY_API_KEY
基础 URLhttps://api.perplexity.ai
需要密钥
免费额度
认证方式Authorization: Bearer 请求头
模型数2

可用模型:

  • sonar-pro (智能) -- 在线搜索增强
  • sonar (平衡) -- 在线搜索增强

设置:

  1. perplexity.ai 注册账号
  2. 前往 API 设置页面生成密钥
  3. export PERPLEXITY_API_KEY="pplx-..."

说明: Perplexity 模型内置网页搜索能力,不支持工具调用。


Cohere

显示名称Cohere
驱动OpenAI 兼容
环境变量COHERE_API_KEY
基础 URLhttps://api.cohere.com/v2
需要密钥
免费额度有(有速率限制的试用版)
认证方式Authorization: Bearer 请求头
模型数2

可用模型:

  • command-r-plus (智能)
  • command-r (平衡)

设置:

  1. dashboard.cohere.com 注册账号
  2. 创建 API 密钥
  3. export COHERE_API_KEY="..."

Cerebras

显示名称Cerebras
驱动OpenAI 兼容
环境变量CEREBRAS_API_KEY
基础 URLhttps://api.cerebras.ai/v1
需要密钥
免费额度有(免费额度充裕)
认证方式Authorization: Bearer 请求头
模型数2

可用模型:

  • cerebras/llama3.3-70b (平衡)
  • cerebras/llama3.1-8b (快速)

设置:

  1. cloud.cerebras.ai 注册账号
  2. 创建 API 密钥
  3. export CEREBRAS_API_KEY="..."

说明: Cerebras 在晶圆级芯片上运行推理,速度极快且价格极低(70B 模型输入和输出均为 $0.06/百万 token)。


SambaNova

显示名称SambaNova
驱动OpenAI 兼容
环境变量SAMBANOVA_API_KEY
基础 URLhttps://api.sambanova.ai/v1
需要密钥
免费额度有(3 个免费模型)
认证方式Authorization: Bearer 请求头
模型数3

可用模型:

  • sambanova/llama-3.3-70b (平衡)

设置:

  1. cloud.sambanova.ai 注册账号
  2. 创建 API 密钥
  3. export SAMBANOVA_API_KEY="..."

Hugging Face

显示名称Hugging Face
驱动OpenAI 兼容
环境变量HF_API_KEY
基础 URLhttps://api-inference.huggingface.co/v1
需要密钥
免费额度
认证方式Authorization: Bearer 请求头
模型数1

可用模型:

  • hf/meta-llama/Llama-3.3-70B-Instruct (平衡)

设置:

  1. huggingface.co 注册账号
  2. 在 Settings > Access Tokens 下创建令牌
  3. export HF_API_KEY="hf_..."

xAI

显示名称xAI
驱动OpenAI 兼容
环境变量XAI_API_KEY
基础 URLhttps://api.x.ai/v1
需要密钥
免费额度有(有限的免费额度)
认证方式Authorization: Bearer 请求头
模型数2

可用模型:

  • grok-2 (智能) -- 支持视觉
  • grok-2-mini (快速)

设置:

  1. console.x.ai 注册账号
  2. 创建 API 密钥
  3. export XAI_API_KEY="xai-..."

Alibaba Coding Plan

显示名称Alibaba Coding Plan (Intl)
驱动OpenAI 兼容
环境变量ALIBABA_CODING_PLAN_API_KEY
基础 URLhttps://coding-intl.dashscope.aliyuncs.com/v1
需要密钥
定价$50/月(订阅制)
免费额度无(仅订阅)
认证方式Authorization: Bearer 请求头
模型数8

可用模型:

  • alibaba-coding-plan/qwen3.6-plus (智能) — 支持视觉,1M 上下文
  • alibaba-coding-plan/qwen3.5-plus (智能) — 支持视觉,1M 上下文
  • alibaba-coding-plan/qwen3-coder-plus (智能) — 1M 上下文
  • alibaba-coding-plan/qwen3-coder-next (旗舰) — 262K 上下文
  • alibaba-coding-plan/qwen3-max-2026-01-23 (旗舰) — 262K 上下文
  • alibaba-coding-plan/glm-5 (旗舰) — 202K 上下文
  • alibaba-coding-plan/glm-4.7 (智能) — 202K 上下文
  • alibaba-coding-plan/kimi-k2.5 (智能) — 支持视觉,262K 上下文
  • alibaba-coding-plan/MiniMax-M2.5 (平衡) — 196K 上下文

设置:

  1. Coding Plan 页面 订阅
  2. 获取计划专用的 API 密钥(格式:sk-sp-xxxxx
  3. export ALIBABA_CODING_PLAN_API_KEY="sk-sp-..."

配额限制(基于订阅,非按量计费):

  • 90,000 次请求/月(在订阅周年日 00:00 UTC+8 重置)
  • 45,000 次请求/周(每周一 00:00 UTC+8 重置)
  • 6,000 次请求/5 小时(滑动窗口 — 每次请求后精确 5 小时重置)

注意事项:

  • 使用 OpenAI 兼容的 API 格式
  • 计划专用的 API 密钥(sk-sp-xxxxx)不同于按量付费的 DashScope 密钥
  • 计量显示 $0 成本(订阅制),但仍会追踪 token 使用量
  • 通过阿里云控制台监控请求配额
  • 不适用于自动化脚本或批量 API 调用 — 仅限编码工具
  • 更多信息:官方文档

Moonshot (Kimi)

显示名称Moonshot / Kimi
Provider IDmoonshot(别名 kimikimi2)
驱动OpenAI 兼容
环境变量MOONSHOT_API_KEY
基础 URLhttps://api.moonshot.ai/v1
需要密钥
免费额度
认证方式Authorization: Bearer 请求头

设置:

  1. Moonshot 平台(国内) 或 Moonshot AI(海外) 注册
  2. 在控制台创建 API key
  3. export MOONSHOT_API_KEY="sk-..."

最小 config.toml

[default_model]
provider = "moonshot"
model = "moonshot-v1-128k"

能力: 聊天补全、tool use、vision(在 kimi-latest / 视觉模型上)、最大 128K 上下文。支持 /files 端点上传文件做多文档 RAG。

说明: Kimi 模型由 Moonshot AI 运营。配置短一点可用 kimi 别名。


Novita AI

显示名称Novita AI
Provider IDnovita(别名:novita-ai
驱动OpenAI 兼容
环境变量NOVITA_API_KEY
基础 URLhttps://api.novita.ai/openai/v1
需要密钥
认证方式Authorization: Bearer 请求头

设置:

  1. novita.ai 注册账号
  2. 在控制台生成 API Key
  3. export NOVITA_API_KEY="..."

最小 config.toml

[default_model]
provider = "novita"
model = "<在 Novita 模型目录里查到的 model id>"

能力: 共享的 OpenAI 兼容驱动支持 tools 和 streaming。视觉支持取决于上游模型 — 启用前请先查 Novita 的模型说明。

注意事项: Novita 通过 OpenAI Chat Completions API 格式暴露目录。设置 NOVITA_API_KEY 后会被自动检测拾取;如果只想作 fallback,不需要显式写 provider


AWS Bedrock

显示名称AWS Bedrock
Provider IDbedrock(别名:aws-bedrock
驱动原生 Bedrock Converse API
环境变量AWS_BEARER_TOKEN_BEDROCK
区域变量AWS_REGION(或 AWS_DEFAULT_REGION,默认 us-east-1
基础 URL按调用拼接:https://bedrock-runtime.{region}.amazonaws.com/model/{model}/converse
需要密钥
认证方式Authorization: Bearer 请求头(Bedrock API Keys,不走 SigV4)

设置:

  1. 在 AWS 控制台创建 Bedrock API Key(长效 bearer token)。这个驱动 走 SigV4。

  2. 选一个在 Bedrock 模型目录里启用了所需模型的区域。

  3. 导出凭据:

    export AWS_BEARER_TOKEN_BEDROCK="..."
    export AWS_REGION="us-east-1"
    

最小 config.toml

[default_model]
provider = "bedrock"
model = "anthropic.claude-sonnet-4-20250514-v1:0"

model 字段会原样拼进 endpoint 路径,所以要写完整的 Bedrock model id(区域前缀如 eu. 或区域要求的 inference profile id 都要带上)。

能力:

  • Tool use(function calling)走 Converse 的 toolConfig 结构,包含完整的 toolResult / toolUse 配对消息修复。
  • 支持 streaming 与非 streaming completion。
  • 视觉未接入:image content block 在请求前被丢弃,因为 Bedrock Converse 不接受 LibreFang 的 Image / ImageFile 形状。
  • prompt-cache token 计数未暴露 — Bedrock Converse 不单独返回 cache_creation_input_tokens / cache_read_input_tokens,metering 里这两个值恒为 0。

注意事项: 区域解析顺序:driver 显式参数 → AWS_REGIONAWS_DEFAULT_REGIONus-east-1。要用区域 inference profile(比如 eu.anthropic.…)就把 AWS_REGION 设成对应区域(eu-west-1 等)并使用带前缀的 model id。