托管 API 提供商

本页覆盖需要 API Key、并通过 LibreFang 原生 Anthropic/Gemini 驱动或共享 OpenAI-compatible 驱动接入的云端模型提供商。

包含的提供商

Anthropic
OpenAI
Google Gemini
DeepSeek
Groq
OpenRouter
Mistral AI
Together AI
Fireworks AI
Perplexity AI
Cohere
Cerebras
SambaNova
Hugging Face
xAI
Alibaba Coding Plan
Moonshot (Kimi)
Novita AI
AWS Bedrock

Anthropic


显示名称	Anthropic
驱动	原生 Anthropic (Messages API)
环境变量	`ANTHROPIC_API_KEY`
基础 URL	`https://api.anthropic.com`
需要密钥	是
免费额度	无
认证方式	`x-api-key` 请求头
模型数	7

可用模型：

claude-opus-4-20250514 (旗舰)
claude-sonnet-4-20250514 (智能)
claude-haiku-4-5-20251001 (快速)

设置：

在 console.anthropic.com 注册账号
在 Settings > API Keys 下创建 API 密钥
export ANTHROPIC_API_KEY="sk-ant-..."

OpenAI


显示名称	OpenAI
驱动	OpenAI 兼容
环境变量	`OPENAI_API_KEY`
基础 URL	`https://api.openai.com/v1`
需要密钥	是
免费额度	无
认证方式	`Authorization: Bearer` 请求头
模型数	18

可用模型：

gpt-4.1 (旗舰)
gpt-4o (智能)
o3-mini (智能)
gpt-4.1-mini (平衡)
gpt-4o-mini (快速)
gpt-4.1-nano (快速)

设置：

在 platform.openai.com 注册账号
在 API Keys 下创建 API 密钥
export OPENAI_API_KEY="sk-..."

Google Gemini


显示名称	Google Gemini
驱动	原生 Gemini (generateContent API)
环境变量	`GEMINI_API_KEY`（或 `GOOGLE_API_KEY`）
基础 URL	`https://generativelanguage.googleapis.com`
需要密钥	是
免费额度	有（免费额度充裕）
认证方式	`x-goog-api-key` 请求头
模型数	10

可用模型：

gemini-2.5-pro (旗舰)
gemini-2.5-flash (智能)
gemini-2.0-flash (快速)

设置：

前往 aistudio.google.com
获取 API 密钥（含免费额度）
export GEMINI_API_KEY="AIza..." 或 export GOOGLE_API_KEY="AIza..."

说明： Gemini 驱动是完全原生的实现，不是 OpenAI 兼容的。模型通过 URL 路径指定，系统提示通过 systemInstruction 传递，工具通过 functionDeclarations 传递，流式传输通过 streamGenerateContent?alt=sse 实现。

DeepSeek


显示名称	DeepSeek
驱动	OpenAI 兼容
环境变量	`DEEPSEEK_API_KEY`
基础 URL	`https://api.deepseek.com/v1`
需要密钥	是
免费额度	无
认证方式	`Authorization: Bearer` 请求头
模型数	4

可用模型：

deepseek-chat (智能) -- DeepSeek V3
deepseek-reasoner (智能) -- DeepSeek R1，不支持工具调用

设置：

在 platform.deepseek.com 注册账号
创建 API 密钥
export DEEPSEEK_API_KEY="sk-..."

Groq


显示名称	Groq
驱动	OpenAI 兼容
环境变量	`GROQ_API_KEY`
基础 URL	`https://api.groq.com/openai/v1`
需要密钥	是
免费额度	有（有速率限制）
认证方式	`Authorization: Bearer` 请求头
模型数	10

可用模型：

llama-3.3-70b-versatile (平衡)
mixtral-8x7b-32768 (平衡)
llama-3.1-8b-instant (快速)
gemma2-9b-it (快速)

设置：

在 console.groq.com 注册账号
创建 API 密钥
export GROQ_API_KEY="gsk_..."

说明： Groq 在自研的 LPU 硬件上运行开源模型，推理速度极快。免费额度有速率限制，但完全可用。

OpenRouter


显示名称	OpenRouter
驱动	OpenAI 兼容
环境变量	`OPENROUTER_API_KEY`
基础 URL	`https://openrouter.ai/api/v1`
需要密钥	是
免费额度	有（8 个免费模型，包括 Step 3.5 Flash、DeepSeek R1、Llama 3.1 8B 等）
认证方式	`Authorization: Bearer` 请求头
模型数	17

可用模型：

openrouter/google/gemini-2.5-flash (智能) -- 便宜、快速、100 万上下文（默认）
openrouter/anthropic/claude-sonnet-4 (智能) -- 强推理 + 工具调用
openrouter/openai/gpt-4o (智能) -- 通过 OpenRouter 使用 GPT-4o
openrouter/deepseek/deepseek-chat (智能) -- DeepSeek V3
openrouter/meta-llama/llama-3.3-70b-instruct (平衡) -- Llama 3.3 70B
openrouter/qwen/qwen-2.5-72b-instruct (平衡) -- Qwen 2.5 72B
openrouter/google/gemini-2.5-pro (旗舰) -- Gemini 2.5 Pro
openrouter/mistralai/mistral-large-latest (智能) -- Mistral Large
openrouter/google/gemma-2-9b-it (快速) -- Gemma 2 9B，免费
openrouter/deepseek/deepseek-r1 (旗舰) -- DeepSeek R1 推理

设置：

在 openrouter.ai 注册账号
在 Keys 下创建 API 密钥
export OPENROUTER_API_KEY="sk-or-..."

说明： OpenRouter 是一个统一的网关，可访问来自多个提供商的 200+ 个模型。模型 ID 使用上游格式（如 google/gemini-2.5-flash）。你可以通过指定带 openrouter/ 前缀的完整模型路径来使用 OpenRouter 目录中的任何模型。

Mistral AI


显示名称	Mistral AI
驱动	OpenAI 兼容
环境变量	`MISTRAL_API_KEY`
基础 URL	`https://api.mistral.ai/v1`
需要密钥	是
免费额度	无
认证方式	`Authorization: Bearer` 请求头
模型数	6

可用模型：

mistral-large-latest (智能)
codestral-latest (智能)
mistral-small-latest (快速)

设置：

在 console.mistral.ai 注册账号
创建 API 密钥
export MISTRAL_API_KEY="..."

Together AI


显示名称	Together AI
驱动	OpenAI 兼容
环境变量	`TOGETHER_API_KEY`
基础 URL	`https://api.together.xyz/v1`
需要密钥	是
免费额度	有（注册赠送有限额度）
认证方式	`Authorization: Bearer` 请求头
模型数	8

可用模型：

meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo (旗舰)
Qwen/Qwen2.5-72B-Instruct-Turbo (智能)
mistralai/Mixtral-8x22B-Instruct-v0.1 (平衡)

设置：

在 api.together.ai 注册账号
创建 API 密钥
export TOGETHER_API_KEY="..."

Fireworks AI


显示名称	Fireworks AI
驱动	OpenAI 兼容
环境变量	`FIREWORKS_API_KEY`
基础 URL	`https://api.fireworks.ai/inference/v1`
需要密钥	是
免费额度	有（注册赠送有限额度）
认证方式	`Authorization: Bearer` 请求头
模型数	5

可用模型：

accounts/fireworks/models/llama-v3p1-405b-instruct (旗舰)
accounts/fireworks/models/mixtral-8x22b-instruct (平衡)

设置：

在 fireworks.ai 注册账号
创建 API 密钥
export FIREWORKS_API_KEY="..."

Perplexity AI


显示名称	Perplexity AI
驱动	OpenAI 兼容
环境变量	`PERPLEXITY_API_KEY`
基础 URL	`https://api.perplexity.ai`
需要密钥	是
免费额度	无
认证方式	`Authorization: Bearer` 请求头
模型数	2

可用模型：

sonar-pro (智能) -- 在线搜索增强
sonar (平衡) -- 在线搜索增强

设置：

在 perplexity.ai 注册账号
前往 API 设置页面生成密钥
export PERPLEXITY_API_KEY="pplx-..."

说明： Perplexity 模型内置网页搜索能力，不支持工具调用。

Cohere


显示名称	Cohere
驱动	OpenAI 兼容
环境变量	`COHERE_API_KEY`
基础 URL	`https://api.cohere.com/v2`
需要密钥	是
免费额度	有（有速率限制的试用版）
认证方式	`Authorization: Bearer` 请求头
模型数	2

可用模型：

command-r-plus (智能)
command-r (平衡)

设置：

在 dashboard.cohere.com 注册账号
创建 API 密钥
export COHERE_API_KEY="..."

Cerebras


显示名称	Cerebras
驱动	OpenAI 兼容
环境变量	`CEREBRAS_API_KEY`
基础 URL	`https://api.cerebras.ai/v1`
需要密钥	是
免费额度	有（免费额度充裕）
认证方式	`Authorization: Bearer` 请求头
模型数	2

可用模型：

cerebras/llama3.3-70b (平衡)
cerebras/llama3.1-8b (快速)

设置：

在 cloud.cerebras.ai 注册账号
创建 API 密钥
export CEREBRAS_API_KEY="..."

说明： Cerebras 在晶圆级芯片上运行推理，速度极快且价格极低（70B 模型输入和输出均为 $0.06/百万 token）。

SambaNova


显示名称	SambaNova
驱动	OpenAI 兼容
环境变量	`SAMBANOVA_API_KEY`
基础 URL	`https://api.sambanova.ai/v1`
需要密钥	是
免费额度	有（3 个免费模型）
认证方式	`Authorization: Bearer` 请求头
模型数	3

可用模型：

sambanova/llama-3.3-70b (平衡)

设置：

在 cloud.sambanova.ai 注册账号
创建 API 密钥
export SAMBANOVA_API_KEY="..."

Hugging Face


显示名称	Hugging Face
驱动	OpenAI 兼容
环境变量	`HF_API_KEY`
基础 URL	`https://api-inference.huggingface.co/v1`
需要密钥	是
免费额度	无
认证方式	`Authorization: Bearer` 请求头
模型数	1

可用模型：

hf/meta-llama/Llama-3.3-70B-Instruct (平衡)

设置：

在 huggingface.co 注册账号
在 Settings > Access Tokens 下创建令牌
export HF_API_KEY="hf_..."

xAI


显示名称	xAI
驱动	OpenAI 兼容
环境变量	`XAI_API_KEY`
基础 URL	`https://api.x.ai/v1`
需要密钥	是
免费额度	有（有限的免费额度）
认证方式	`Authorization: Bearer` 请求头
模型数	2

可用模型：

grok-2 (智能) -- 支持视觉
grok-2-mini (快速)

设置：

在 console.x.ai 注册账号
创建 API 密钥
export XAI_API_KEY="xai-..."

Alibaba Coding Plan


显示名称	Alibaba Coding Plan (Intl)
驱动	OpenAI 兼容
环境变量	`ALIBABA_CODING_PLAN_API_KEY`
基础 URL	`https://coding-intl.dashscope.aliyuncs.com/v1`
需要密钥	是
定价	$50/月（订阅制）
免费额度	无（仅订阅）
认证方式	`Authorization: Bearer` 请求头
模型数	8

可用模型：

alibaba-coding-plan/qwen3.6-plus (智能) — 支持视觉，1M 上下文
alibaba-coding-plan/qwen3.5-plus (智能) — 支持视觉，1M 上下文
alibaba-coding-plan/qwen3-coder-plus (智能) — 1M 上下文
alibaba-coding-plan/qwen3-coder-next (旗舰) — 262K 上下文
alibaba-coding-plan/qwen3-max-2026-01-23 (旗舰) — 262K 上下文
alibaba-coding-plan/glm-5 (旗舰) — 202K 上下文
alibaba-coding-plan/glm-4.7 (智能) — 202K 上下文
alibaba-coding-plan/kimi-k2.5 (智能) — 支持视觉，262K 上下文
alibaba-coding-plan/MiniMax-M2.5 (平衡) — 196K 上下文

设置：

在 Coding Plan 页面订阅
获取计划专用的 API 密钥（格式：sk-sp-xxxxx）
export ALIBABA_CODING_PLAN_API_KEY="sk-sp-..."

配额限制（基于订阅，非按量计费）：

90,000 次请求/月（在订阅周年日 00:00 UTC+8 重置）
45,000 次请求/周（每周一 00:00 UTC+8 重置）
6,000 次请求/5 小时（滑动窗口 — 每次请求后精确 5 小时重置）

注意事项：

使用 OpenAI 兼容的 API 格式
计划专用的 API 密钥（sk-sp-xxxxx）不同于按量付费的 DashScope 密钥
计量显示 $0 成本（订阅制），但仍会追踪 token 使用量
通过阿里云控制台监控请求配额
不适用于自动化脚本或批量 API 调用 — 仅限编码工具
更多信息：官方文档

Moonshot (Kimi)


显示名称	Moonshot / Kimi
Provider ID	`moonshot`（别名 `kimi`、`kimi2`)
驱动	OpenAI 兼容
环境变量	`MOONSHOT_API_KEY`
基础 URL	`https://api.moonshot.ai/v1`
需要密钥	是
免费额度	无
认证方式	`Authorization: Bearer` 请求头

设置：

在 Moonshot 平台(国内) 或 Moonshot AI(海外) 注册
在控制台创建 API key
export MOONSHOT_API_KEY="sk-..."

最小 config.toml：

[default_model]
provider = "moonshot"
model = "moonshot-v1-128k"

能力: 聊天补全、tool use、vision(在 kimi-latest / 视觉模型上)、最大 128K 上下文。支持 /files 端点上传文件做多文档 RAG。

说明: Kimi 模型由 Moonshot AI 运营。配置短一点可用 kimi 别名。

Novita AI


显示名称	Novita AI
Provider ID	`novita`（别名：`novita-ai`）
驱动	OpenAI 兼容
环境变量	`NOVITA_API_KEY`
基础 URL	`https://api.novita.ai/openai/v1`
需要密钥	是
认证方式	`Authorization: Bearer` 请求头

设置：

在 novita.ai 注册账号
在控制台生成 API Key
export NOVITA_API_KEY="..."

最小 config.toml：

[default_model]
provider = "novita"
model = "<在 Novita 模型目录里查到的 model id>"

能力： 共享的 OpenAI 兼容驱动支持 tools 和 streaming。视觉支持取决于上游模型 — 启用前请先查 Novita 的模型说明。

注意事项： Novita 通过 OpenAI Chat Completions API 格式暴露目录。设置 NOVITA_API_KEY 后会被自动检测拾取；如果只想作 fallback，不需要显式写 provider。

AWS Bedrock


显示名称	AWS Bedrock
Provider ID	`bedrock`（别名：`aws-bedrock`）
驱动	原生 Bedrock Converse API
环境变量	`AWS_BEARER_TOKEN_BEDROCK`
区域变量	`AWS_REGION`（或 `AWS_DEFAULT_REGION`，默认 `us-east-1`）
基础 URL	按调用拼接：`https://bedrock-runtime.{region}.amazonaws.com/model/{model}/converse`
需要密钥	是
认证方式	`Authorization: Bearer` 请求头（Bedrock API Keys，不走 SigV4）

设置：

在 AWS 控制台创建 Bedrock API Key（长效 bearer token）。这个驱动不走 SigV4。
选一个在 Bedrock 模型目录里启用了所需模型的区域。

导出凭据：

export AWS_BEARER_TOKEN_BEDROCK="..."
export AWS_REGION="us-east-1"

最小 config.toml：

[default_model]
provider = "bedrock"
model = "anthropic.claude-sonnet-4-20250514-v1:0"

model 字段会原样拼进 endpoint 路径，所以要写完整的 Bedrock model id（区域前缀如 eu. 或区域要求的 inference profile id 都要带上）。

能力：

Tool use（function calling）走 Converse 的 toolConfig 结构，包含完整的 toolResult / toolUse 配对消息修复。
支持 streaming 与非 streaming completion。
视觉未接入：image content block 在请求前被丢弃，因为 Bedrock Converse 不接受 LibreFang 的 Image / ImageFile 形状。
prompt-cache token 计数未暴露 — Bedrock Converse 不单独返回 cache_creation_input_tokens / cache_read_input_tokens，metering 里这两个值恒为 0。

注意事项： 区域解析顺序：driver 显式参数 → AWS_REGION → AWS_DEFAULT_REGION → us-east-1。要用区域 inference profile（比如 eu.anthropic.…）就把 AWS_REGION 设成对应区域（eu-west-1 等）并使用带前缀的 model id。