Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.kr/llms.txt
Use this file to discover all available pages before exploring further.
Ollama
Ollama 是一个本地 LLM 运行时,可以让你轻松在自己的机器上运行开源模型。OpenClaw 集成了 Ollama 的原生 API(/api/chat),支持流式传输和工具调用,并且在你选择使用 OLLAMA_API_KEY(或凭证配置文件)且未定义显式 models.providers.ollama 条目时,可以自动发现本地 Ollama 模型。
快速开始
新手引导向导(推荐)
通过设置向导配置 Ollama 是最快的方法:- 询问你的 Ollama base URL,也就是可以访问你的实例的地址(默认
http://127.0.0.1:11434)。 - 让你选择 Cloud + Local(云端模型和本地模型)或 Local(仅本地模型)。
- 如果你选择 Cloud + Local 且尚未登录 ollama.com,则打开浏览器登录流程。
- 发现可用模型并建议默认值。
- 如果所选模型本地不可用,则自动拉取它。
手动设置
- 安装 Ollama:https://ollama.com/download
- 如果你想进行本地推理,先拉取一个本地模型:
- 如果你也想使用云端模型,请先登录:
- 运行新手引导并选择
Ollama:
Local:仅本地模型Cloud + Local:本地模型加云端模型- 云端模型如
kimi-k2.5:cloud、minimax-m2.5:cloud和glm-5:cloud不需要 本地执行ollama pull
- 本地默认:
glm-4.7-flash - 云端默认:
kimi-k2.5:cloud、minimax-m2.5:cloud、glm-5:cloud
- 如果你更喜欢手动设置,也可以直接为 OpenClaw 启用 Ollama(任意值都可以;Ollama 不需要真实 key):
- 查看或切换模型:
- 或者在配置中设置默认值:
模型发现(隐式提供商)
当你设置OLLAMA_API_KEY(或凭证配置文件),并且未定义 models.providers.ollama 时,OpenClaw 会从 http://127.0.0.1:11434 上的本地 Ollama 实例发现模型:
- 查询
/api/tags - 在可用时,尽力通过
/api/show查找contextWindow - 通过模型名称启发式规则标记
reasoning(r1、reasoning、think) - 将
maxTokens设置为 OpenClaw 使用的默认 Ollama 最大 token 上限 - 将所有成本设置为
0
models.providers.ollama,则会跳过自动发现,你必须手动定义模型(见下文)。
配置
基本设置(隐式发现)
启用 Ollama 的最简单方式是通过环境变量:显式设置(手动模型)
以下情况适合使用显式配置:- Ollama 运行在其他主机/端口上。
- 你想强制指定特定的上下文窗口或模型列表。
- 你希望完全手动定义模型。
OLLAMA_API_KEY,你可以在提供商条目中省略 apiKey,OpenClaw 会在可用性检查时自动填充它。
自定义 base URL(显式配置)
如果 Ollama 运行在不同的主机或端口上(显式配置会禁用自动发现,因此你需要手动定义模型):模型选择
配置完成后,你的所有 Ollama 模型都可用:云端模型
云端模型让你可以将云托管模型(例如kimi-k2.5:cloud、minimax-m2.5:cloud、glm-5:cloud)与本地模型一起使用。
要使用云端模型,请在设置期间选择 Cloud + Local 模式。向导会检查你是否已登录,并在需要时打开浏览器登录流程。如果无法验证认证状态,向导会回退到本地模型默认值。
你也可以直接在 ollama.com/signin 登录。
高级用法
推理模型
OpenClaw 默认会将名称中包含deepseek-r1、reasoning 或 think 的模型视为支持推理的模型:
模型成本
Ollama 是免费的,并且在本地运行,因此所有模型成本都设置为 $0。流式传输配置
OpenClaw 的 Ollama 集成默认使用 原生 Ollama API(/api/chat),它完全支持同时进行流式传输和工具调用。无需任何特殊配置。
旧版 OpenAI 兼容模式
如果你确实需要改用 OpenAI 兼容端点(例如,在只支持 OpenAI 格式的代理之后),请显式设置api: "openai-completions":
params: { streaming: false } 禁用流式传输。
当 Ollama 使用 api: "openai-completions" 时,OpenClaw 默认会注入 options.num_ctx,这样 Ollama 就不会静默回退到 4096 上下文窗口。如果你的代理/上游拒绝未知的 options 字段,请禁用此行为:
上下文窗口
对于自动发现的模型,OpenClaw 会在 Ollama 提供时使用其报告的上下文窗口,否则回退到 OpenClaw 使用的默认 Ollama 上下文窗口。你可以在显式提供商配置中覆盖contextWindow 和 maxTokens。
故障排除
未检测到 Ollama
请确认 Ollama 正在运行,并且你已设置OLLAMA_API_KEY(或凭证配置文件),而且没有定义显式的 models.providers.ollama 条目:
没有可用模型
如果没有列出你的模型,可以:- 在本地拉取该模型,或者
- 在
models.providers.ollama中显式定义该模型。
连接被拒绝
检查 Ollama 是否正在正确的端口上运行:另请参阅
- Model Providers - 所有提供商的概览
- Model Selection - 如何选择模型
- Configuration - 完整配置参考