Appearance
01 · 整体概览:哲学与决策树
在动手装任何东西之前,先想清楚:我到底要一个什么样的私人助理,为什么是这套方案。
一、目标与边界
这套方法论解决什么问题?
把"我想要一个私人 AI 助理"这个模糊愿望 → 落地成一个自己掌控、长期可用、能力够强的系统。
核心诉求(本次实践确定的):
- 💬 日常聊天、写作、查资料
- 📚 能基于我自己的文档/笔记回答(私人知识库 / RAG)
- 🎙️ 支持语音对话
- 📱 能从微信 / Telegram 等聊天软件随时找它
- 🔀 本地模型 + 云端 API 混合:简单任务走本地免费,复杂任务走 Claude/GPT
不解决什么:
- ❌ 写代码 → 继续用 Cursor,不并入助理(见哲学 3)
- ❌ 训练 / 微调模型
- ❌ 多人/企业级多租户
二、核心哲学
哲学 1:先验证,再上重型方案
私人助理生态里有"轻量"和"重型"两类方案。先用最简单的跑通,确认手感和真实需求,再上复杂的全功能平台。
反例:上来就装 OwnPilot/Orbis 全家桶 → 配置一堆、踩一堆坑 → 还没体验到价值就放弃
正例:先 Ollama + Open WebUI 跑通本地聊天(20 分钟)→ 确认值得 → 再加知识库/渠道/语音哲学 2:本地与云端混合,不做二选一
纯本地(隐私好但模型弱)和纯云端(强但要钱、数据外流)都不是最优。混合才是甜点:
| 任务类型 | 走哪条线 | 为什么 |
|---|---|---|
| 日常闲聊、改写、翻译、总结 | 本地 Qwen3 30B | 免费、隐私、够用 |
| 复杂推理、长链路 Agent、写代码 | 云端 Claude / GPT | 2026 年本地模型在多步骤任务上仍明显弱 |
智能路由(cheapest / fastest / smartest)能自动在两者间切换,详见
02-architecture.md。
哲学 3:助理归助理,写代码归 Cursor
很多全功能助理都号称"能写代码",但体验远不如专用 IDE。不要硬塞:
- 写代码 → Cursor(专业工具,主场)
- 私人助理 → 聊天、知识库、语音、多渠道
两件事拆开,各用最强的工具。
哲学 4:数据自己掌控,但接受模型走云端
"私人"的核心是对话历史、知识库、凭证都存在自己机器上。模型本身用云端 API 是可以接受的折中——因为 API 调用是无状态的,厂商不留你的知识库。
三、选型决策树
每一步都面临选择,下面是本次实践得出的"推荐路径":
决策 1:部署在哪台设备?
你有能 7×24 常开的设备吗?
├── 有常开 Mac / 服务器 → 部署在它上面(推荐)
├── 只有笔记本但当台式用、不搬走 → 也可以(本次就是这种)
│ ⚠️ 注意防止合盖休眠,见 04 部署章
└── 笔记本经常带出门 → 考虑 $5/月 VPS,或用云端托管方案这次我选:MacBook Pro M5 Pro / 48GB,当台式常开——配置足够同时跑本地模型和助理平台。
决策 2:要不要本地模型?
你在意 API 费用 / 隐私吗?48GB+ 内存能跑得动好模型。
├── 在意 + 硬件够 → 本地 + 云端混合(推荐)
├── 完全不在意、只要最省心 → 纯云端 API
└── 极度隐私敏感、可接受模型弱一些 → 纯本地这次我选:混合——本地跑 Qwen3 30B 兜底日常,云端 Claude 处理硬任务。
决策 3:用哪个"门面"(界面 / 平台)?
你的主要需求是什么?
├── 就想要个好用的 ChatGPT 替代 + 知识库 → Open WebUI(推荐起步)
├── 主要是"和我的文档对话" → AnythingLLM
├── 要语音 + 多渠道 + 记忆的全功能助理 → OwnPilot / Orbis
└── 要可视化搭 Agent 工作流 → Dify这次的路径:先 Open WebUI 起步(覆盖聊天 + 知识库 + 接云端模型),验证后再上 OwnPilot 补齐语音 + 多渠道。详见 03-toolchain.md。
决策 4:本地模型选哪个?
你的内容主要是中文吗?内存多大?
├── 中文为主 + 48GB → Qwen3 30B(推荐,中文强)
├── 偏代码任务 → Qwen3 Coder 30B
├── 要更快更省内存 → GPT-OSS 20B / Gemma 4
└── 16GB 小内存 → 7-8B 模型(Llama / Qwen 小杯)这次我选:Qwen3 30B——48GB 内存能轻松跑,中文综合能力好。
决策 5:怎么远程访问?
你要在外面(不在家)也能用吗?
├── 要 → Tailscale(私有组网,最省心)或 Cloudflare Tunnel
└── 只在家里局域网用 → 直接 http://局域网IP:端口 即可这次倾向:Tailscale——零配置、安全、手机也能连回家里的助理。
四、典型路径(如果一切顺利)
阶段 0 规划方案、写文档(当前所在)
↓
阶段 1 装 Ollama + 拉 Qwen3 30B(验证本地模型,30 分钟)
↓
阶段 2 装 Open WebUI,接本地模型 + 云端 Claude(聊天 + 知识库跑通)
↓
阶段 3 配 Tailscale,手机也能访问
↓
阶段 4 (可选)上 OwnPilot/Orbis 补齐语音 + Telegram 多渠道
↓
完成:一个自己掌控的、混合驱动的私人助理五、典型坑(按出现顺序,先剧透)
详见各章,这里是简版预警:
- 笔记本合盖就休眠 → 助理掉线,需用
caffeinate或电源设置防睡 - Docker 里连不上宿主机 Ollama → 要用
host.docker.internal而非localhost - OpenAI 兼容端点要带
/v1→http://localhost:11434/v1,不是裸地址 - 本地模型同时加载多个会爆内存 → 设
OLLAMA_MAX_LOADED_MODELS=1 - 微信没有官方个人 API → 多渠道先从 Telegram 起步,微信要绕路
- 全功能平台(OwnPilot/Orbis)较新 → 文档不全、偶发 bug,做好排错准备
六、什么时候不用这套方法论
- 你只是偶尔问问 AI → 直接用网页版 ChatGPT/Claude,别折腾自托管
- 没有能常开的设备、也不想买 VPS → 自托管价值大打折扣
- 完全不想碰命令行 / Docker → 用桌面应用 Jan.ai 或 AnythingLLM 桌面版
下一步
继续看 02-architecture.md,了解混合架构具体怎么搭。