Skip to main content

Command Palette

Search for a command to run...

我用 Warp 终端 + Ollama 打造了一个"零成本AI编程助手",花了一晚上彻底戒掉了Copilot

Updated
2 min read
我用 Warp 终端 + Ollama 打造了一个"零成本AI编程助手",花了一晚上彻底戒掉了Copilot

昨晚十点半,我正准备给一个爬虫脚本加个批量重试功能。

Copilot 的订阅刚好到期了。我对着空荡荡的编辑器发了一会儿呆,然后突然想起 Reddit 上有人提过 Warp 终端的 AI 功能——"用人话操作命令行",不用联网、不用付费。

我决定试试。

我的痛点:AI 编程工具越来越贵

GitHub Copilot 月费 10 美元,Claude API 按 token 计费,对于我这种独立开发者来说,每个月的 AI 支出已经变成了一笔需要算计的账单。更重要的是,有些项目涉及内部数据,我并不想让代码和上下文经过第三方服务器。

那天晚上我搜了一圈,发现 Reddit r/programming 里有个帖子提到了一个组合:Warp 终端 + Ollama。Warp 是一个带 AI 的终端,Ollama 是本地大模型运行工具。两者的组合,让我看到了"零成本、无隐私顾虑"的 AI 编程可能性。

第一步:安装 Warp 终端

说实话,我一开始只是想换个更好看的终端。

Warp(warp.dev)是这两年在 Hacker News 上很火的项目,用 Rust 写,支持 macOS、Windows、Linux。它和传统终端最大的区别是内置了 AI Block 功能——你可以在终端里直接用自然语言描述你想做的事情,AI 会生成对应的命令,甚至直接执行。

安装很简单:

# macOS
brew install warp

# Windows
winget install warp

# Linux
curl -fsSL https://apt.packages.warp.dev/warp-signing.gpg | sudo apt-key add -
echo "deb https://apt.packages.warp.dev stable main" | sudo tee /etc/apt/sources.list.d/warp.list
sudo apt update && sudo apt install warp

装完之后,我顺手打开了 Warp 的 AI Block 功能——设置 → AI Features → 开启"Block with AI"。

第二步:Ollama 本地跑模型

接下来是 Ollama。

Ollama(ollama.com)是这两年最火的本地 LLM 运行工具,核心卖点是"一行命令跑模型"。它会自动下载模型文件,在本地运行,不需要任何云服务。

安装步骤:

# macOS / Linux
curl -fsSL https://ollama.com/install.sh | sh

# Windows
# 直接下载 OllamaSetup.exe,从 ollama.com/download 安装

安装完成后,拉取一个适合编程的模型:

# Qwen2.5:1.5B - 体积小,编程能力不错,MacBook 8GB 内存也能跑
ollama run qwen2.5:1.5b

# 如果电脑性能更好,可以试试 7B 或 14B
ollama run qwen2.5:7b

我在 Windows 上跑了 Qwen2.5:1.5B,第一次启动时 Ollama 自动下载了模型文件(约 1GB),之后直接在本地运行,零延迟,零费用

第三步:让 Warp 和 Ollama 联动

这是最让我惊喜的一步。

Warp 的 AI Block 默认调用的是云端 AI(需要联网),但它也支持自定义 AI Provider。我按照文档,把 Ollama 设置为了 Warp 的本地 AI 后端:

  1. 打开 Warp → 设置 → AI Providers → 添加 Custom Provider
  2. API Endpoint 填 http://localhost:11434(Ollama 的默认端口)
  3. Model 填 qwen2.5:1.5b

这样,在 Warp 里按 Cmd/Ctrl + K 调出 AI Block,直接输入中文描述,Warp 就会调用本地的 Ollama 模型来生成命令或代码。

实测效果:我用它完成了一整晚的开发

那天晚上,我用它做了以下事情:

  • 生成正则表达式:我输入"帮我写一个匹配中文邮箱的正则",Warp AI 立刻返回了准确的正则表达式,直接复制到代码里。
  • 解释错误日志:我把一段报错日志复制进去,问"这个报错是什么意思",Ollama 用中文给出了清晰的解释,并附上了修复建议。
  • 写批量重试逻辑:我描述了需求——"给这个爬虫加一个指数退避的重试机制,最多重试5次"——Warp AI 生成了完整的 Python 代码,我审阅后直接使用。

全程没有打开 Copilot,没有联网查询,没有等待 API 响应。

更有意思的是,因为 Ollama 完全在本地运行,我的代码和上下文从来没有离开过我的电脑。这种"隐私安全感"是付费 API 给不了的。

一句话总结

把 Warp 终端和 Ollama 组合起来,你就拥有了一个完全免费、完全本地运行、零延迟的 AI 编程助手。对于独立开发者来说,这个组合的性价比远超过任何付费订阅。

唯一的前提是你的电脑有足够的内存(8GB 以上跑 1.5B 模型基本没问题)。


rayslifelab.com

14 views

More from this blog

拒绝被AI套牢:我是如何用自带密钥把推理成本压到零的

我拒绝每个月给AI公司送钱后,发现了一个更香的办法。 事情是这样的。前几个月不是AI火嘛,我也跟风搞了个小工具。刚开始一切美好——AI公司白给的免费额度跟不要钱似的。三个月后,免费额度用完了,我傻眼了:一个月200刀!还不够我一个人造的。 这哪是工具?这是个碎钞机。 我开始琢磨:能不能不花这冤枉钱?还真让我想出一个损招——BYOK(Bring Your Own Key,自带密钥)。 我的方案是这样的 我在工具里留了一个设置项:你想用自己的API Key?没问题,自己填进去。推理成本?用户自己扛。...

May 7, 20261 min read4
拒绝被AI套牢:我是如何用自带密钥把推理成本压到零的

把家人照片传到云端AI到底有多危险?我在断网状态下用本地算力建了一个私密人脸库

上个月我干了一件让我后怕的事。 为了找去年春节拍的一张全家福,我把整个相册——包括孩子的、家人的、自己的几千张照片——一股脑丢进了一个"智能相册"App。它确实好用,输入"戴红色围巾的妈妈"秒出结果。 但第二天我看到一条新闻:某大厂被曝用用户上传的私人照片训练面部识别模型。 我的脸、我孩子的脸、我妻子的脸,全变成了训练数据。 那一刻我决定:再也不把照片传到任何云端AI了。 我的痛点:找照片是刚需,但隐私不能妥协 给家人找照片这件事,几乎每周都会发生—— "那张在海边的照片你还有吗?""去年生日那...

May 7, 20261 min read
把家人照片传到云端AI到底有多危险?我在断网状态下用本地算力建了一个私密人脸库

I Consumed AI Content for 2 Years. Then I Decided to Build Something With It

中文图文 我消费了两年 AI 工具后,决定用 AI 做点东西——然后做出来了 我大概在 2024 年初就开始用 ChatGPT 了。 那时候每天刷各种 AI 新闻、收藏教程、订阅 Newsletter,朋友圈分享 AI 工具的文章必点赞。我觉得自己很"懂" AI。 但有一天我仔细算了一下:两年来,我到底用 AI 做成了什么事? 答案是:0 件。 我让 AI 给我写过诗、润色过邮件、翻译过文档——这些有用,但它们本质上只是"用 AI 说话"。不是用 AI 做事。 我的转折点:那个我想解决的痛点...

Apr 28, 20261 min read
I Consumed AI Content for 2 Years. Then I Decided to Build Something With It
R

Ray's blog

18 posts