平台与托管端点
本页覆盖通过平台专用网关、企业云集成、托管推理平台或区域模型市场接入的提供商,而不是单一的一方模型厂商 API。
包含的提供商
- Replicate
- NVIDIA NIM
- DeepInfra
- Azure OpenAI
- GitHub Models(Azure AI Inference)
- Qwen (DashScope)
- MiniMax
- Qianfan(百度)
- VolcEngine(豆包)
- BytePlus ModelArk
- Zhipu(GLM)
- Zhipu Coding(CodeGeex)
- Z.ai
- Vertex AI
关于 Bedrock: AWS Bedrock 已挪到 托管 API 页面 —— 当前驱动用长效 bearer token(
AWS_BEARER_TOKEN_BEDROCK)鉴权而不是逐请求 SigV4 签名。原本在本页的 SigV4 条目已删除。
Replicate
| 显示名称 | Replicate |
| 驱动 | OpenAI 兼容 |
| 环境变量 | REPLICATE_API_TOKEN |
| 基础 URL | https://api.replicate.com/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 1 |
可用模型:
replicate/meta-llama-3.3-70b-instruct(平衡)
设置:
- 在 replicate.com 注册账号
- 前往 Account > API Tokens
export REPLICATE_API_TOKEN="r8_..."
NVIDIA NIM
| 显示名称 | NVIDIA NIM |
| 驱动 | OpenAI 兼容 |
| 环境变量 | NVIDIA_API_KEY |
| 基础 URL | https://integrate.api.nvidia.com/v1 |
| 需要密钥 | 是 |
| 免费额度 | 有(有限额度) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | Llama、Mistral 及 NVIDIA 优化模型 |
设置:
- 在 build.nvidia.com 注册账号
- 创建 API 密钥
export NVIDIA_API_KEY="nvapi-..."
DeepInfra
| 显示名称 | DeepInfra |
| 驱动 | OpenAI 兼容 |
| 环境变量 | DEEPINFRA_API_KEY |
| 基础 URL | https://api.deepinfra.com/v1/openai |
| 需要密钥 | 是 |
| 免费额度 | 有(有限额度) |
| 认证方式 | Authorization: Bearer 请求头 |
| 模型数 | 低成本开源模型 |
设置:
- 在 deepinfra.com 注册账号
- 创建 API 密钥
export DEEPINFRA_API_KEY="..."
Azure OpenAI
| 显示名称 | Azure OpenAI |
| 驱动 | OpenAI 兼容 |
| 环境变量 | AZURE_OPENAI_API_KEY、AZURE_OPENAI_ENDPOINT |
| 基础 URL | https://<your-resource>.openai.azure.com/openai/deployments/<deployment> |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | api-key 请求头 |
| 模型数 | GPT-4o、GPT-4 及其他 Azure 托管模型 |
设置:
- 在 Azure 门户 中创建 Azure OpenAI 资源
- 在 Azure OpenAI Studio 中部署模型
- 设置环境变量:
export AZURE_OPENAI_API_KEY="..." export AZURE_OPENAI_ENDPOINT="https://<your-resource>.openai.azure.com"
GitHub Models(Azure AI Inference)
| 显示名称 | Microsoft |
| Provider ID | microsoft(别名 github-models) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | GITHUB_MODELS_TOKEN |
| 基础 URL | https://models.inference.ai.azure.com |
| 需要密钥 | 是 |
| 免费额度 | 是(按 GitHub 套餐限速) |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 登录 github.com/marketplace/models
- 生成一个 fine-grained Personal Access Token(Models 端点不需要 repository scope)
export GITHUB_MODELS_TOKEN="ghp_..."(同一把 PAT 也是github-copilot用的GITHUB_TOKEN,但环境变量保持独立,这样配置一个产品不会顺带激活另一个)
最小 config.toml:
[default_model]
provider = "microsoft"
model = "phi-4"
说明: 虽然 provider id 叫 microsoft,但实际是 GitHub Models / Azure AI Inference 端点,与 azure-openai(指向你自有 Azure OpenAI 部署,通过 AZURE_OPENAI_ENDPOINT 路由)以及 github-copilot(IDE 端的 Copilot 订阅)都不同。模型通过 catalog 加载,包含第三方托管模型如 meta-llama-3-70b-instruct、mistral-large、phi-4 等。
Qwen (DashScope)
| 显示名称 | Qwen |
| 驱动 | OpenAI 兼容 |
| 环境变量 | DASHSCOPE_API_KEY |
| 基础 URL | https://dashscope.aliyuncs.com/compatible-mode/v1 |
| 别名 | dashscope、model_studio |
| 需要密钥 | 是 |
| 免费额度 | 有(注册赠送有限额度) |
| 认证方式 | Authorization: Bearer 请求头 |
区域:
| 区域 | 端点 | API 密钥环境变量 |
|---|---|---|
| (默认) | dashscope.aliyuncs.com | DASHSCOPE_API_KEY |
intl | dashscope-intl.aliyuncs.com | DASHSCOPE_API_KEY |
us | dashscope-us.aliyuncs.com | DASHSCOPE_API_KEY |
设置:
- 在 DashScope 控制台 注册账号
- 创建 API 密钥
export DASHSCOPE_API_KEY="sk-..."- 可选:在
config.toml中选择区域:[provider_regions] qwen = "intl" # 或 "us"
说明: Qwen 使用阿里云的 DashScope API。默认端点服务于中国大陆;如在中国境外使用,建议选择 intl 或 us 区域以降低延迟。模型定义在注册表 TOML 中,在启动时加载。
MiniMax
| 显示名称 | MiniMax |
| 驱动 | OpenAI 兼容 |
| 环境变量 | MINIMAX_API_KEY |
| 基础 URL | https://api.minimax.io/v1 |
| 需要密钥 | 是 |
| 免费额度 | 无 |
| 认证方式 | Authorization: Bearer 请求头 |
区域:
| 区域 | 端点 | API 密钥环境变量 |
|---|---|---|
| (默认) | api.minimax.io | MINIMAX_API_KEY |
china | api.minimaxi.com | MINIMAX_CN_API_KEY |
设置:
- 在 minimax.io(国际版)或 minimaxi.com(中国版)注册账号
- 创建 API 密钥
export MINIMAX_API_KEY="..."- 中国区域设置:
[provider_regions] minimax = "china"export MINIMAX_CN_API_KEY="..."
媒体生成: 除了 LLM 聊天模型外,MiniMax 还通过 Creator Hand 或媒体 API 端点提供媒体生成能力:
| 模态 | 模型 | 描述 |
|---|---|---|
| 图片 | image-01 | 文本生成图片 |
| 语音 | speech-2.8-hd | 高质量文本转语音 |
| 视频 | T2V-01 | 文本生成视频(异步) |
| 音乐 | music-2.5 | 音乐生成,支持可选歌词 |
这些功能通过 /api/media/* 端点或 image_generate、video_generate、music_generate、text_to_speech 工具访问。
说明: MiniMax 国际版(minimax.io)和中国版(minimaxi.com)使用不同的 API 密钥。选择 china 区域时,LibreFang 会自动从 MINIMAX_CN_API_KEY 而非 MINIMAX_API_KEY 读取密钥。
Qianfan(百度)
| 显示名称 | Qianfan |
| Provider ID | qianfan(别名 baidu) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | QIANFAN_API_KEY |
| 基础 URL | https://qianfan.baidubce.com/v2 |
| 需要密钥 | 是 |
| 免费额度 | 注册有限免费额度 |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 在百度千帆控制台注册
- 在 IAM 面板创建 API key
export QIANFAN_API_KEY="..."
最小 config.toml:
[default_model]
provider = "qianfan"
model = "ernie-4.0-8k"
说明: 千帆是百度的 LLM 平台;ernie-4.0、ernie-4.0-turbo、ernie-speed 等系列通过 OpenAI 兼容的 v2 端点暴露。ernie-4.0+ 支持工具与 function calling。
VolcEngine(豆包)
| 显示名称 | VolcEngine / Doubao |
| Provider ID | volcengine(别名 doubao) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | VOLCENGINE_API_KEY |
| 基础 URL | https://ark.cn-beijing.volces.com/api/v3 |
| 需要密钥 | 是 |
| 免费额度 | 注册赠送额度 |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 在火山引擎控制台注册
- 在 Ark > 推理接入点 创建端点,记录其模型 ID(
ep-...) - 在 Ark > API Keys 生成 API key
export VOLCENGINE_API_KEY="..."
最小 config.toml:
[default_model]
provider = "volcengine"
model = "ep-20240101120000-abcde" # 端点 ID, 不是模型名
说明: 豆包是字节跳动的 LLM 产品,通过火山引擎 Ark 推理平台暴露。和大多 provider 不同,model 字段必须填端点 ID(ep-...),不是模型家族名。豆包 1.5 / 1.6 端点支持 vision 与工具。Coding Plan 端点(https://ark.cn-beijing.volces.com/api/coding/v3)注册为独立 provider volcengine_coding,使用 VOLCENGINE_CODING_API_KEY —— 两个端点都用就把同一把 key 值同时导出到两个环境变量。
BytePlus ModelArk
火山引擎国际版。同一套 Ark 平台,区域为 ap-southeast,USD 计价。下面两个端点使用独立环境变量(byteplus 用 BYTEPLUS_API_KEY,byteplus_coding 用 BYTEPLUS_CODING_API_KEY)—— 同一把 BytePlus 账号 key 在两边都能用,只需把同一个值导出到对应环境变量名下。
byteplus — 标准 /api/v3 端点
| 显示名称 | BytePlus ModelArk |
| Provider ID | byteplus |
| 驱动 | OpenAI 兼容 |
| 环境变量 | BYTEPLUS_API_KEY |
| 基础 URL | https://ark.ap-southeast.bytepluses.com/api/v3 |
| 需要密钥 | 是 |
| 认证方式 | Authorization: Bearer 请求头 |
[default_model]
provider = "byteplus"
model = "seed-2-0-pro-260328" # 版本化快照 ID, 见 byteplus.toml
byteplus_coding — Anthropic 兼容的 coding 端点
| 显示名称 | BytePlus Coding Plan |
| Provider ID | byteplus_coding |
| 驱动 | Anthropic 兼容(/v1/messages) |
| 环境变量 | BYTEPLUS_CODING_API_KEY |
| 基础 URL | https://ark.ap-southeast.bytepluses.com/api/coding |
| 认证方式 | x-api-key + anthropic-version 请求头 |
[default_model]
provider = "byteplus_coding"
model = "ark-code-latest" # 自动路由的友好别名
设置:
- 在 BytePlus 控制台 注册
- 在 ModelArk > Model Inventory 激活想用的模型
- 在 ModelArk > API Keys 生成 API key
export BYTEPLUS_API_KEY="..."(给标准byteplus端点用)export BYTEPLUS_CODING_API_KEY="..."(给byteplus_coding端点用 —— 同一把 key 值,独立环境变量)
说明: byteplus 用版本化快照 ID(如 seed-2-0-pro-260328)。byteplus_coding 用友好别名(如 ark-code-latest 自动路由,以及 dola-seed-2.0-pro、kimi-k2.5、glm-4.7、gpt-oss-120b)— 这些别名在模型升级时保持稳定。
Zhipu(GLM)
| 显示名称 | 智谱 GLM |
| Provider ID | zhipu(别名 glm) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | ZHIPU_API_KEY |
| 基础 URL | https://open.bigmodel.cn/api/paas/v4 |
| 需要密钥 | 是 |
| 免费额度 | 是(每月免费配额) |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 在智谱开放平台注册
- 在 账户 > API Keys 生成 API key
export ZHIPU_API_KEY="..."
最小 config.toml:
[default_model]
provider = "zhipu"
model = "glm-4-plus"
说明: 智谱开发 GLM(General Language Model)系列。支持工具、vision、embedding。z.ai(下面)是同一后端的国际区域前端,但注册为独立 provider,使用独立的 ZAI_API_KEY。Coding Plan 端点(zhipu_coding、zai_coding)同样使用独立的 ZHIPU_CODING_API_KEY 与 ZAI_CODING_API_KEY。在智谱注册一次,把同一个 key 值按需导出到对应的环境变量名下。
Zhipu Coding(CodeGeex)
| 显示名称 | CodeGeex |
| Provider ID | zhipu-coding(别名 codegeex) |
| 驱动 | OpenAI 兼容 |
| 环境变量 | ZHIPU_CODING_API_KEY |
| 基础 URL | https://open.bigmodel.cn/api/coding/paas/v4 |
| 需要密钥 | 是 |
| 免费额度 | 是(算在同一个智谱配额里) |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 复用上面的智谱 API key(在智谱开放平台注册一次)
export ZHIPU_CODING_API_KEY="..."(与ZHIPU_API_KEY同值;独立环境变量,避免配置 Zhipu chat 时把 Coding 端点也自动激活)
最小 config.toml:
[default_model]
provider = "zhipu-coding"
model = "codegeex-4"
说明: 服务 CodeGeex 模型的编码专用端点。鉴权同 Zhipu/GLM,但基础 URL 不同 —— 想要 fill-in-the-middle / 仓库感知的代码补全而不是通用 chat 时用这个 provider。
Z.ai
| 显示名称 | Z.ai |
| Provider ID | z.ai |
| 驱动 | OpenAI 兼容 |
| 环境变量 | ZAI_API_KEY |
| 基础 URL | https://api.z.ai/api/paas/v4 |
| 需要密钥 | 是 |
| 免费额度 | 是(算在同一个智谱配额里) |
| 认证方式 | Authorization: Bearer 请求头 |
设置:
- 复用智谱 API key(在智谱开放平台注册一次)
export ZAI_API_KEY="..."(与ZHIPU_API_KEY同值;独立环境变量,避免配置 Zhipu chat 时把 z.ai 端点也自动激活)
最小 config.toml:
[default_model]
provider = "z.ai"
model = "glm-4-plus"
说明: Z.ai 品牌端点 —— 后端是同一个智谱,做了海外流量路由。Coding 变体 zai_coding(基础 URL https://api.z.ai/api/coding/paas/v4)注册为独立 provider,使用 ZAI_CODING_API_KEY(把同一把智谱 key 值再导出一份)。
Vertex AI
| 显示名称 | Google Vertex AI |
| 驱动 | 原生 Gemini(通过 Vertex 使用 generateContent API) |
| 配置段 | [vertex_ai] |
| 环境变量 | GOOGLE_APPLICATION_CREDENTIALS、VERTEX_PROJECT、VERTEX_LOCATION |
| 基础 URL | https://<location>-aiplatform.googleapis.com |
| 需要密钥 | 是(服务账号 JSON 或 gcloud CLI) |
| 免费额度 | 无 |
| 认证方式 | OAuth2 服务账号或 gcloud auth print-access-token |
| 模型数 | 通过 Google Cloud Vertex AI 企业端点使用 Gemini 模型 |
设置:
- 在 Google Cloud 控制台 中启用 Vertex AI API
- 创建服务账号密钥文件,或使用
gcloud auth application-default login进行认证 - 设置环境变量:
# 方式 A:服务账号密钥文件 export GOOGLE_APPLICATION_CREDENTIALS="/path/to/service-account.json" export VERTEX_PROJECT="your-gcp-project" export VERTEX_LOCATION="us-central1" # 方式 B:gcloud CLI(无需密钥文件) gcloud auth application-default login export VERTEX_PROJECT="your-gcp-project" export VERTEX_LOCATION="us-central1" - 在
config.toml中配置:[vertex_ai] project = "your-gcp-project" location = "us-central1"
说明: Vertex AI 使用与原生 Gemini 驱动相同的 generateContent API 格式,但通过 Google Cloud OAuth2 而非 API 密钥进行认证。访问令牌缓存约 50 分钟的 TTL,并在到期前自动刷新。端点格式为 https://{location}-aiplatform.googleapis.com/v1/projects/{project}/locations/{location}/publishers/google/models/{model}:generateContent。