我用 Warp 终端 + Ollama 打造了一个"零成本AI编程助手",花了一晚上彻底戒掉了Copilot

昨晚十点半,我正准备给一个爬虫脚本加个批量重试功能。
Copilot 的订阅刚好到期了。我对着空荡荡的编辑器发了一会儿呆,然后突然想起 Reddit 上有人提过 Warp 终端的 AI 功能——"用人话操作命令行",不用联网、不用付费。
我决定试试。
我的痛点:AI 编程工具越来越贵
GitHub Copilot 月费 10 美元,Claude API 按 token 计费,对于我这种独立开发者来说,每个月的 AI 支出已经变成了一笔需要算计的账单。更重要的是,有些项目涉及内部数据,我并不想让代码和上下文经过第三方服务器。
那天晚上我搜了一圈,发现 Reddit r/programming 里有个帖子提到了一个组合:Warp 终端 + Ollama。Warp 是一个带 AI 的终端,Ollama 是本地大模型运行工具。两者的组合,让我看到了"零成本、无隐私顾虑"的 AI 编程可能性。
第一步:安装 Warp 终端
说实话,我一开始只是想换个更好看的终端。
Warp(warp.dev)是这两年在 Hacker News 上很火的项目,用 Rust 写,支持 macOS、Windows、Linux。它和传统终端最大的区别是内置了 AI Block 功能——你可以在终端里直接用自然语言描述你想做的事情,AI 会生成对应的命令,甚至直接执行。
安装很简单:
# macOS
brew install warp
# Windows
winget install warp
# Linux
curl -fsSL https://apt.packages.warp.dev/warp-signing.gpg | sudo apt-key add -
echo "deb https://apt.packages.warp.dev stable main" | sudo tee /etc/apt/sources.list.d/warp.list
sudo apt update && sudo apt install warp
装完之后,我顺手打开了 Warp 的 AI Block 功能——设置 → AI Features → 开启"Block with AI"。
第二步:Ollama 本地跑模型
接下来是 Ollama。
Ollama(ollama.com)是这两年最火的本地 LLM 运行工具,核心卖点是"一行命令跑模型"。它会自动下载模型文件,在本地运行,不需要任何云服务。
安装步骤:
# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh
# Windows
# 直接下载 OllamaSetup.exe,从 ollama.com/download 安装
安装完成后,拉取一个适合编程的模型:
# Qwen2.5:1.5B - 体积小,编程能力不错,MacBook 8GB 内存也能跑
ollama run qwen2.5:1.5b
# 如果电脑性能更好,可以试试 7B 或 14B
ollama run qwen2.5:7b
我在 Windows 上跑了 Qwen2.5:1.5B,第一次启动时 Ollama 自动下载了模型文件(约 1GB),之后直接在本地运行,零延迟,零费用。
第三步:让 Warp 和 Ollama 联动
这是最让我惊喜的一步。
Warp 的 AI Block 默认调用的是云端 AI(需要联网),但它也支持自定义 AI Provider。我按照文档,把 Ollama 设置为了 Warp 的本地 AI 后端:
- 打开 Warp → 设置 → AI Providers → 添加 Custom Provider
- API Endpoint 填
http://localhost:11434(Ollama 的默认端口) - Model 填
qwen2.5:1.5b
这样,在 Warp 里按 Cmd/Ctrl + K 调出 AI Block,直接输入中文描述,Warp 就会调用本地的 Ollama 模型来生成命令或代码。
实测效果:我用它完成了一整晚的开发
那天晚上,我用它做了以下事情:
- 生成正则表达式:我输入"帮我写一个匹配中文邮箱的正则",Warp AI 立刻返回了准确的正则表达式,直接复制到代码里。
- 解释错误日志:我把一段报错日志复制进去,问"这个报错是什么意思",Ollama 用中文给出了清晰的解释,并附上了修复建议。
- 写批量重试逻辑:我描述了需求——"给这个爬虫加一个指数退避的重试机制,最多重试5次"——Warp AI 生成了完整的 Python 代码,我审阅后直接使用。
全程没有打开 Copilot,没有联网查询,没有等待 API 响应。
更有意思的是,因为 Ollama 完全在本地运行,我的代码和上下文从来没有离开过我的电脑。这种"隐私安全感"是付费 API 给不了的。
一句话总结
把 Warp 终端和 Ollama 组合起来,你就拥有了一个完全免费、完全本地运行、零延迟的 AI 编程助手。对于独立开发者来说,这个组合的性价比远超过任何付费订阅。
唯一的前提是你的电脑有足够的内存(8GB 以上跑 1.5B 模型基本没问题)。
rayslifelab.com





