Skip to content

01 · 整体概览:哲学与决策树

在动手装任何东西之前,先想清楚:我到底要一个什么样的私人助理,为什么是这套方案。


一、目标与边界

这套方法论解决什么问题?

把"我想要一个私人 AI 助理"这个模糊愿望 → 落地成一个自己掌控、长期可用、能力够强的系统。

核心诉求(本次实践确定的):

  • 💬 日常聊天、写作、查资料
  • 📚 能基于我自己的文档/笔记回答(私人知识库 / RAG)
  • 🎙️ 支持语音对话
  • 📱 能从微信 / Telegram 等聊天软件随时找它
  • 🔀 本地模型 + 云端 API 混合:简单任务走本地免费,复杂任务走 Claude/GPT

不解决什么:

  • ❌ 写代码 → 继续用 Cursor,不并入助理(见哲学 3)
  • ❌ 训练 / 微调模型
  • ❌ 多人/企业级多租户

二、核心哲学

哲学 1:先验证,再上重型方案

私人助理生态里有"轻量"和"重型"两类方案。先用最简单的跑通,确认手感和真实需求,再上复杂的全功能平台。

反例:上来就装 OwnPilot/Orbis 全家桶 → 配置一堆、踩一堆坑 → 还没体验到价值就放弃
正例:先 Ollama + Open WebUI 跑通本地聊天(20 分钟)→ 确认值得 → 再加知识库/渠道/语音

哲学 2:本地与云端混合,不做二选一

纯本地(隐私好但模型弱)和纯云端(强但要钱、数据外流)都不是最优。混合才是甜点:

任务类型走哪条线为什么
日常闲聊、改写、翻译、总结本地 Qwen3 30B免费、隐私、够用
复杂推理、长链路 Agent、写代码云端 Claude / GPT2026 年本地模型在多步骤任务上仍明显弱

智能路由(cheapest / fastest / smartest)能自动在两者间切换,详见 02-architecture.md

哲学 3:助理归助理,写代码归 Cursor

很多全功能助理都号称"能写代码",但体验远不如专用 IDE。不要硬塞

  • 写代码 → Cursor(专业工具,主场)
  • 私人助理 → 聊天、知识库、语音、多渠道

两件事拆开,各用最强的工具。

哲学 4:数据自己掌控,但接受模型走云端

"私人"的核心是对话历史、知识库、凭证都存在自己机器上。模型本身用云端 API 是可以接受的折中——因为 API 调用是无状态的,厂商不留你的知识库。


三、选型决策树

每一步都面临选择,下面是本次实践得出的"推荐路径":

决策 1:部署在哪台设备?

你有能 7×24 常开的设备吗?
├── 有常开 Mac / 服务器 → 部署在它上面(推荐)
├── 只有笔记本但当台式用、不搬走 → 也可以(本次就是这种)
│        ⚠️ 注意防止合盖休眠,见 04 部署章
└── 笔记本经常带出门 → 考虑 $5/月 VPS,或用云端托管方案

这次我选MacBook Pro M5 Pro / 48GB,当台式常开——配置足够同时跑本地模型和助理平台。

决策 2:要不要本地模型?

你在意 API 费用 / 隐私吗?48GB+ 内存能跑得动好模型。
├── 在意 + 硬件够 → 本地 + 云端混合(推荐)
├── 完全不在意、只要最省心 → 纯云端 API
└── 极度隐私敏感、可接受模型弱一些 → 纯本地

这次我选混合——本地跑 Qwen3 30B 兜底日常,云端 Claude 处理硬任务。

决策 3:用哪个"门面"(界面 / 平台)?

你的主要需求是什么?
├── 就想要个好用的 ChatGPT 替代 + 知识库 → Open WebUI(推荐起步)
├── 主要是"和我的文档对话" → AnythingLLM
├── 要语音 + 多渠道 + 记忆的全功能助理 → OwnPilot / Orbis
└── 要可视化搭 Agent 工作流 → Dify

这次的路径先 Open WebUI 起步(覆盖聊天 + 知识库 + 接云端模型),验证后再上 OwnPilot 补齐语音 + 多渠道。详见 03-toolchain.md

决策 4:本地模型选哪个?

你的内容主要是中文吗?内存多大?
├── 中文为主 + 48GB → Qwen3 30B(推荐,中文强)
├── 偏代码任务 → Qwen3 Coder 30B
├── 要更快更省内存 → GPT-OSS 20B / Gemma 4
└── 16GB 小内存 → 7-8B 模型(Llama / Qwen 小杯)

这次我选Qwen3 30B——48GB 内存能轻松跑,中文综合能力好。

决策 5:怎么远程访问?

你要在外面(不在家)也能用吗?
├── 要 → Tailscale(私有组网,最省心)或 Cloudflare Tunnel
└── 只在家里局域网用 → 直接 http://局域网IP:端口 即可

这次倾向Tailscale——零配置、安全、手机也能连回家里的助理。


四、典型路径(如果一切顺利)

阶段 0  规划方案、写文档(当前所在)

阶段 1  装 Ollama + 拉 Qwen3 30B(验证本地模型,30 分钟)

阶段 2  装 Open WebUI,接本地模型 + 云端 Claude(聊天 + 知识库跑通)

阶段 3  配 Tailscale,手机也能访问

阶段 4  (可选)上 OwnPilot/Orbis 补齐语音 + Telegram 多渠道

完成:一个自己掌控的、混合驱动的私人助理

五、典型坑(按出现顺序,先剧透)

详见各章,这里是简版预警:

  1. 笔记本合盖就休眠 → 助理掉线,需用 caffeinate 或电源设置防睡
  2. Docker 里连不上宿主机 Ollama → 要用 host.docker.internal 而非 localhost
  3. OpenAI 兼容端点要带 /v1http://localhost:11434/v1,不是裸地址
  4. 本地模型同时加载多个会爆内存 → 设 OLLAMA_MAX_LOADED_MODELS=1
  5. 微信没有官方个人 API → 多渠道先从 Telegram 起步,微信要绕路
  6. 全功能平台(OwnPilot/Orbis)较新 → 文档不全、偶发 bug,做好排错准备

六、什么时候用这套方法论

  • 你只是偶尔问问 AI → 直接用网页版 ChatGPT/Claude,别折腾自托管
  • 没有能常开的设备、也不想买 VPS → 自托管价值大打折扣
  • 完全不想碰命令行 / Docker → 用桌面应用 Jan.ai 或 AnythingLLM 桌面版

下一步

继续看 02-architecture.md,了解混合架构具体怎么搭。

私人 AI 助理部署方法论 · 部署于 Cloudflare Pages