托管 API 提供商
本页覆盖需要 API Key、并通过 LibreFang 原生 Anthropic/Gemini 驱动或共享 OpenAI-compatible 驱动接入的云端模型提供商。
包含的提供商
- Anthropic
- OpenAI
- Google Gemini
- DeepSeek
- Groq
- OpenRouter
- Mistral AI
- Together AI
- Fireworks AI
- Perplexity AI
- Cohere
- Cerebras
- SambaNova
- Hugging Face
- xAI
- Alibaba Coding Plan
- Moonshot (Kimi)
- Novita AI
- AWS Bedrock
Anthropic
| 显示名称 | Anthropic |
| 驱动 | 原生 Anthropic (Messages API) |
| 环境变量 | ANTHROPIC_API_KEY |
| 基础 URL | https://api.anthropic.com |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | x-api-key 请求头 |
| 模型数 | 7 |
可用模型:
claude-opus-4-20250514(旗舰)claude-sonnet-4-20250514(智能)claude-haiku-4-5-20251001(快速)
设置:
- 在 console.anthropic.com 注册账号
- 在 Settings > API Keys 下创建 API 密钥
export ANTHROPIC_API_KEY="sk-ant-..."
OpenAI
| 显示名称 | OpenAI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | OPENAI_API_KEY |
| 基础 URL | https://api.openai.com/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 18 |
可用模型:
gpt-4.1(旗舰)gpt-4o(智能)o3-mini(智能)gpt-4.1-mini(平衡)gpt-4o-mini(快速)gpt-4.1-nano(快速)
设置:
- 在 platform.openai.com 注册账号
- 在 API Keys 下创建 API 密钥
export OPENAI_API_KEY="sk-..."
Google Gemini
| 显示名称 | Google Gemini |
| 驱动 | 原生 Gemini (generateContent API) |
| 环境变量 | GEMINI_API_KEY(或 GOOGLE_API_KEY) |
| 基础 URL | https://generativelanguage.googleapis.com |
| 需要密钥 | 是 |
| 免费额度 | 有(免费额度充裕) |
| 认证方式 | x-goog-api-key 请求头 |
| 模型数 | 10 |
可用模型:
gemini-2.5-pro(旗舰)gemini-2.5-flash(智能)gemini-2.0-flash(快速)
设置:
- 前往 aistudio.google.com
- 获取 API 密钥(含免费额度)
export GEMINI_API_KEY="AIza..."或export GOOGLE_API_KEY="AIza..."
说明: Gemini 驱动是完全原生的实现,不是 OpenAI 兼容的。模型通过 URL 路径指定,系统提示通过 systemInstruction 传递,工具通过 functionDeclarations 传递,流式传输通过 streamGenerateContent?alt=sse 实现。
DeepSeek
| 显示名称 | DeepSeek |
| 驱动 | OpenAI 兼容 |
| 环境变量 | DEEPSEEK_API_KEY |
| 基础 URL | https://api.deepseek.com/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 4 |
可用模型:
deepseek-chat(智能) -- DeepSeek V3deepseek-reasoner(智能) -- DeepSeek R1,不支持工具调用
设置:
- 在 platform.deepseek.com 注册账号
- 创建 API 密钥
export DEEPSEEK_API_KEY="sk-..."
Groq
| 显示名称 | Groq |
| 驱动 | OpenAI 兼容 |
| 环境变量 | GROQ_API_KEY |
| 基础 URL | https://api.groq.com/openai/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(有速率限制) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 10 |
可用模型:
llama-3.3-70b-versatile(平衡)mixtral-8x7b-32768(平衡)llama-3.1-8b-instant(快速)gemma2-9b-it(快速)
设置:
- 在 console.groq.com 注册账号
- 创建 API 密钥
export GROQ_API_KEY="gsk_..."
说明: Groq 在自研的 LPU 硬件上运行开源模型,推理速度极快。免费额度有速率限制,但完全可用。
OpenRouter
| 显示名称 | OpenRouter |
| 驱动 | OpenAI 兼容 |
| 环境变量 | OPENROUTER_API_KEY |
| 基础 URL | https://openrouter.ai/api/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(8 个免费模型,包括 Step 3.5 Flash、DeepSeek R1、Llama 3.1 8B 等) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 17 |
可用模型:
openrouter/google/gemini-2.5-flash(智能) -- 便宜、快速、100 万上下文(默认)openrouter/anthropic/claude-sonnet-4(智能) -- 强推理 + 工具调用openrouter/openai/gpt-4o(智能) -- 通过 OpenRouter 使用 GPT-4oopenrouter/deepseek/deepseek-chat(智能) -- DeepSeek V3openrouter/meta-llama/llama-3.3-70b-instruct(平衡) -- Llama 3.3 70Bopenrouter/qwen/qwen-2.5-72b-instruct(平衡) -- Qwen 2.5 72Bopenrouter/google/gemini-2.5-pro(旗舰) -- Gemini 2.5 Proopenrouter/mistralai/mistral-large-latest(智能) -- Mistral Largeopenrouter/google/gemma-2-9b-it(快速) -- Gemma 2 9B,免费openrouter/deepseek/deepseek-r1(旗舰) -- DeepSeek R1 推理
设置:
- 在 openrouter.ai 注册账号
- 在 Keys 下创建 API 密钥
export OPENROUTER_API_KEY="sk-or-..."
说明: OpenRouter 是一个统一的网关,可访问来自多个提供商的 200+ 个模型。模型 ID 使用上游格式(如 google/gemini-2.5-flash)。你可以通过指定带 openrouter/ 前缀的完整模型路径来使用 OpenRouter 目录中的任何模型。
Mistral AI
| 显示名称 | Mistral AI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | MISTRAL_API_KEY |
| 基础 URL | https://api.mistral.ai/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 6 |
可用模型:
mistral-large-latest(智能)codestral-latest(智能)mistral-small-latest(快速)
设置:
- 在 console.mistral.ai 注册账号
- 创建 API 密钥
export MISTRAL_API_KEY="..."
Together AI
| 显示名称 | Together AI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | TOGETHER_API_KEY |
| 基础 URL | https://api.together.xyz/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(注册赠送有限额度) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 8 |
可用模型:
meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo(旗舰)Qwen/Qwen2.5-72B-Instruct-Turbo(智能)mistralai/Mixtral-8x22B-Instruct-v0.1(平衡)
设置:
- 在 api.together.ai 注册账号
- 创建 API 密钥
export TOGETHER_API_KEY="..."
Fireworks AI
| 显示名称 | Fireworks AI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | FIREWORKS_API_KEY |
| 基础 URL | https://api.fireworks.ai/inference/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(注册赠送有限额度) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 5 |
可用模型:
accounts/fireworks/models/llama-v3p1-405b-instruct(旗舰)accounts/fireworks/models/mixtral-8x22b-instruct(平衡)
设置:
- 在 fireworks.ai 注册账号
- 创建 API 密钥
export FIREWORKS_API_KEY="..."
Perplexity AI
| 显示名称 | Perplexity AI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | PERPLEXITY_API_KEY |
| 基础 URL | https://api.perplexity.ai |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 2 |
可用模型:
sonar-pro(智能) -- 在线搜索增强sonar(平衡) -- 在线搜索增强
设置:
- 在 perplexity.ai 注册账号
- 前往 API 设置页面生成密钥
export PERPLEXITY_API_KEY="pplx-..."
说明: Perplexity 模型内置网页搜索能力,不支持工具调用。
Cohere
| 显示名称 | Cohere |
| 驱动 | OpenAI 兼容 |
| 环境变量 | COHERE_API_KEY |
| 基础 URL | https://api.cohere.com/v2 |
| 需要密钥 | 是 |
| 免费额度 | 有(有速率限制的试用版) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 2 |
可用模型:
command-r-plus(智能)command-r(平衡)
设置:
- 在 dashboard.cohere.com 注册账号
- 创建 API 密钥
export COHERE_API_KEY="..."
Cerebras
| 显示名称 | Cerebras |
| 驱动 | OpenAI 兼容 |
| 环境变量 | CEREBRAS_API_KEY |
| 基础 URL | https://api.cerebras.ai/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(免费额度充裕) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 2 |
可用模型:
cerebras/llama3.3-70b(平衡)cerebras/llama3.1-8b(快速)
设置:
- 在 cloud.cerebras.ai 注册账号
- 创建 API 密钥
export CEREBRAS_API_KEY="..."
说明: Cerebras 在晶圆级芯片上运行推理,速度极快且价格极低(70B 模型输入和输出均为 $0.06/百万 token)。
SambaNova
| 显示名称 | SambaNova |
| 驱动 | OpenAI 兼容 |
| 环境变量 | SAMBANOVA_API_KEY |
| 基础 URL | https://api.sambanova.ai/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(3 个免费模型) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 3 |
可用模型:
sambanova/llama-3.3-70b(平衡)
设置:
- 在 cloud.sambanova.ai 注册账号
- 创建 API 密钥
export SAMBANOVA_API_KEY="..."
Hugging Face
| 显示名称 | Hugging Face |
| 驱动 | OpenAI 兼容 |
| 环境变量 | HF_API_KEY |
| 基础 URL | https://api-inference.huggingface.co/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 1 |
可用模型:
hf/meta-llama/Llama-3.3-70B-Instruct(平衡)
设置:
- 在 huggingface.co 注册账号
- 在 Settings > Access Tokens 下创建令牌
export HF_API_KEY="hf_..."
xAI
| 显示名称 | xAI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | XAI_API_KEY |
| 基础 URL | https://api.x.ai/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(有限的免费额度) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 2 |
可用模型:
grok-2(智能) -- 支持视觉grok-2-mini(快速)
设置:
- 在 console.x.ai 注册账号
- 创建 API 密钥
export XAI_API_KEY="xai-..."
Alibaba Coding Plan
| 显示名称 | Alibaba Coding Plan (Intl) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | ALIBABA_CODING_PLAN_API_KEY |
| 基础 URL | https://coding-intl.dashscope.aliyuncs.com/v1 |
| 需要密钥 | 是 |
| 定价 | $50/月(订阅制) |
| 免费额度 | 无(仅订阅) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 8 |
可用模型:
alibaba-coding-plan/qwen3.6-plus(智能) — 支持视觉,1M 上下文alibaba-coding-plan/qwen3.5-plus(智能) — 支持视觉,1M 上下文alibaba-coding-plan/qwen3-coder-plus(智能) — 1M 上下文alibaba-coding-plan/qwen3-coder-next(旗舰) — 262K 上下文alibaba-coding-plan/qwen3-max-2026-01-23(旗舰) — 262K 上下文alibaba-coding-plan/glm-5(旗舰) — 202K 上下文alibaba-coding-plan/glm-4.7(智能) — 202K 上下文alibaba-coding-plan/kimi-k2.5(智能) — 支持视觉,262K 上下文alibaba-coding-plan/MiniMax-M2.5(平衡) — 196K 上下文
设置:
- 在 Coding Plan 页面 订阅
- 获取计划专用的 API 密钥(格式:
sk-sp-xxxxx) export ALIBABA_CODING_PLAN_API_KEY="sk-sp-..."
配额限制(基于订阅,非按量计费):
- 90,000 次请求/月(在订阅周年日 00:00 UTC+8 重置)
- 45,000 次请求/周(每周一 00:00 UTC+8 重置)
- 6,000 次请求/5 小时(滑动窗口 — 每次请求后精确 5 小时重置)
注意事项:
- 使用 OpenAI 兼容的 API 格式
- 计划专用的 API 密钥(
sk-sp-xxxxx)不同于按量付费的 DashScope 密钥 - 计量显示 $0 成本(订阅制),但仍会追踪 token 使用量
- 通过阿里云控制台监控请求配额
- 不适用于自动化脚本或批量 API 调用 — 仅限编码工具
- 更多信息:官方文档
Moonshot (Kimi)
| 显示名称 | Moonshot / Kimi |
| Provider ID | moonshot(别名 kimi、kimi2) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | MOONSHOT_API_KEY |
| 基础 URL | https://api.moonshot.ai/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 在 Moonshot 平台(国内) 或 Moonshot AI(海外) 注册
- 在控制台创建 API key
export MOONSHOT_API_KEY="sk-..."
最小 config.toml:
[default_model]
provider = "moonshot"
model = "moonshot-v1-128k"
能力: 聊天补全、tool use、vision(在 kimi-latest / 视觉模型上)、最大 128K 上下文。支持 /files 端点上传文件做多文档 RAG。
说明: Kimi 模型由 Moonshot AI 运营。配置短一点可用 kimi 别名。
Novita AI
| 显示名称 | Novita AI |
| Provider ID | novita(别名:novita-ai) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | NOVITA_API_KEY |
| 基础 URL | https://api.novita.ai/openai/v1 |
| 需要密钥 | 是 |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 在 novita.ai 注册账号
- 在控制台生成 API Key
export NOVITA_API_KEY="..."
最小 config.toml:
[default_model]
provider = "novita"
model = "<在 Novita 模型目录里查到的 model id>"
能力: 共享的 OpenAI 兼容驱动支持 tools 和 streaming。视觉支持取决于上游模型 — 启用前请先查 Novita 的模型说明。
注意事项: Novita 通过 OpenAI Chat Completions API 格式暴露目录。设置 NOVITA_API_KEY 后会被自动检测拾取;如果只想作 fallback,不需要显式写 provider。
AWS Bedrock
| 显示名称 | AWS Bedrock |
| Provider ID | bedrock(别名:aws-bedrock) |
| 驱动 | 原生 Bedrock Converse API |
| 环境变量 | AWS_BEARER_TOKEN_BEDROCK |
| 区域变量 | AWS_REGION(或 AWS_DEFAULT_REGION,默认 us-east-1) |
| 基础 URL | 按调用拼接:https://bedrock-runtime.{region}.amazonaws.com/model/{model}/converse |
| 需要密钥 | 是 |
| 认证方式 | Authorization: Bearer 请求头(Bedrock API Keys,不走 SigV4) |
设置:
-
在 AWS 控制台创建 Bedrock API Key(长效 bearer token)。这个驱动 不 走 SigV4。
-
选一个在 Bedrock 模型目录里启用了所需模型的区域。
-
导出凭据:
export AWS_BEARER_TOKEN_BEDROCK="..." export AWS_REGION="us-east-1"
最小 config.toml:
[default_model]
provider = "bedrock"
model = "anthropic.claude-sonnet-4-20250514-v1:0"
model 字段会原样拼进 endpoint 路径,所以要写完整的 Bedrock model id(区域前缀如 eu. 或区域要求的 inference profile id 都要带上)。
能力:
- Tool use(function calling)走 Converse 的
toolConfig结构,包含完整的toolResult/toolUse配对消息修复。 - 支持 streaming 与非 streaming completion。
- 视觉未接入:image content block 在请求前被丢弃,因为 Bedrock Converse 不接受 LibreFang 的
Image/ImageFile形状。 - prompt-cache token 计数未暴露 — Bedrock Converse 不单独返回
cache_creation_input_tokens/cache_read_input_tokens,metering 里这两个值恒为 0。
注意事项: 区域解析顺序:driver 显式参数 → AWS_REGION → AWS_DEFAULT_REGION → us-east-1。要用区域 inference profile(比如 eu.anthropic.…)就把 AWS_REGION 设成对应区域(eu-west-1 等)并使用带前缀的 model id。