我用 Warp 终端 + Ollama 打造了一个"零成本AI编程助手"，花了一晚上彻底戒掉了Copilot

昨晚十点半，我正准备给一个爬虫脚本加个批量重试功能。

Copilot 的订阅刚好到期了。我对着空荡荡的编辑器发了一会儿呆，然后突然想起 Reddit 上有人提过 Warp 终端的 AI 功能——"用人话操作命令行"，不用联网、不用付费。

我决定试试。

我的痛点：AI 编程工具越来越贵

GitHub Copilot 月费 10 美元，Claude API 按 token 计费，对于我这种独立开发者来说，每个月的 AI 支出已经变成了一笔需要算计的账单。更重要的是，有些项目涉及内部数据，我并不想让代码和上下文经过第三方服务器。

那天晚上我搜了一圈，发现 Reddit r/programming 里有个帖子提到了一个组合：Warp 终端 + Ollama。Warp 是一个带 AI 的终端，Ollama 是本地大模型运行工具。两者的组合，让我看到了"零成本、无隐私顾虑"的 AI 编程可能性。

第一步：安装 Warp 终端

说实话，我一开始只是想换个更好看的终端。

Warp（warp.dev）是这两年在 Hacker News 上很火的项目，用 Rust 写，支持 macOS、Windows、Linux。它和传统终端最大的区别是内置了 AI Block 功能——你可以在终端里直接用自然语言描述你想做的事情，AI 会生成对应的命令，甚至直接执行。

安装很简单：

# macOS
brew install warp

# Windows
winget install warp

# Linux
curl -fsSL https://apt.packages.warp.dev/warp-signing.gpg | sudo apt-key add -
echo "deb https://apt.packages.warp.dev stable main" | sudo tee /etc/apt/sources.list.d/warp.list
sudo apt update && sudo apt install warp

装完之后，我顺手打开了 Warp 的 AI Block 功能——设置 → AI Features → 开启"Block with AI"。

第二步：Ollama 本地跑模型

接下来是 Ollama。

Ollama（ollama.com）是这两年最火的本地 LLM 运行工具，核心卖点是"一行命令跑模型"。它会自动下载模型文件，在本地运行，不需要任何云服务。

安装步骤：

# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh

# Windows
# 直接下载 OllamaSetup.exe，从 ollama.com/download 安装

安装完成后，拉取一个适合编程的模型：

# Qwen2.5:1.5B - 体积小，编程能力不错，MacBook 8GB 内存也能跑
ollama run qwen2.5:1.5b

# 如果电脑性能更好，可以试试 7B 或 14B
ollama run qwen2.5:7b

我在 Windows 上跑了 Qwen2.5:1.5B，第一次启动时 Ollama 自动下载了模型文件（约 1GB），之后直接在本地运行，零延迟，零费用。

第三步：让 Warp 和 Ollama 联动

这是最让我惊喜的一步。

Warp 的 AI Block 默认调用的是云端 AI（需要联网），但它也支持自定义 AI Provider。我按照文档，把 Ollama 设置为了 Warp 的本地 AI 后端：

打开 Warp → 设置 → AI Providers → 添加 Custom Provider
API Endpoint 填 http://localhost:11434（Ollama 的默认端口）
Model 填 qwen2.5:1.5b

这样，在 Warp 里按 Cmd/Ctrl + K 调出 AI Block，直接输入中文描述，Warp 就会调用本地的 Ollama 模型来生成命令或代码。

实测效果：我用它完成了一整晚的开发

那天晚上，我用它做了以下事情：

生成正则表达式：我输入"帮我写一个匹配中文邮箱的正则"，Warp AI 立刻返回了准确的正则表达式，直接复制到代码里。
解释错误日志：我把一段报错日志复制进去，问"这个报错是什么意思"，Ollama 用中文给出了清晰的解释，并附上了修复建议。
写批量重试逻辑：我描述了需求——"给这个爬虫加一个指数退避的重试机制，最多重试5次"——Warp AI 生成了完整的 Python 代码，我审阅后直接使用。

全程没有打开 Copilot，没有联网查询，没有等待 API 响应。

更有意思的是，因为 Ollama 完全在本地运行，我的代码和上下文从来没有离开过我的电脑。这种"隐私安全感"是付费 API 给不了的。

一句话总结

把 Warp 终端和 Ollama 组合起来，你就拥有了一个完全免费、完全本地运行、零延迟的 AI 编程助手。对于独立开发者来说，这个组合的性价比远超过任何付费订阅。

唯一的前提是你的电脑有足够的内存（8GB 以上跑 1.5B 模型基本没问题）。

rayslifelab.com

我用 Warp 终端 + Ollama 打造了一个"零成本AI编程助手"，花了一晚上彻底戒掉了Copilot

我的痛点：AI 编程工具越来越贵

第一步：安装 Warp 终端

第二步：Ollama 本地跑模型

第三步：让 Warp 和 Ollama 联动

实测效果：我用它完成了一整晚的开发

一句话总结

Comments

More from this blog

拒绝被AI套牢：我是如何用自带密钥把推理成本压到零的

How I Built a Zero-Inference-Cost AI App by Bringing My Own API Key

把家人照片传到云端AI到底有多危险？我在断网状态下用本地算力建了一个私密人脸库

How Dangerous Is It to Upload Family Photos to Cloud AI? I Built a Private Face Library Offline

I Consumed AI Content for 2 Years. Then I Decided to Build Something With It

Command Palette

我的痛点：AI 编程工具越来越贵

第一步：安装 Warp 终端

第二步：Ollama 本地跑模型

第三步：让 Warp 和 Ollama 联动

实测效果：我用它完成了一整晚的开发

一句话总结

Comments

More from this blog