01 · 整体概览：哲学与决策树

在动手装任何东西之前，先想清楚：我到底要一个什么样的私人助理，为什么是这套方案。

一、目标与边界

这套方法论解决什么问题？

把"我想要一个私人 AI 助理"这个模糊愿望 → 落地成一个自己掌控、长期可用、能力够强的系统。

核心诉求（本次实践确定的）：

💬 日常聊天、写作、查资料
📚 能基于我自己的文档/笔记回答（私人知识库 / RAG）
🎙️ 支持语音对话
📱 能从微信 / Telegram 等聊天软件随时找它
🔀 本地模型 + 云端 API 混合：简单任务走本地免费，复杂任务走 Claude/GPT

不解决什么：

❌ 写代码 → 继续用 Cursor，不并入助理（见哲学 3）
❌ 训练 / 微调模型
❌ 多人/企业级多租户

二、核心哲学

哲学 1：先验证，再上重型方案

私人助理生态里有"轻量"和"重型"两类方案。先用最简单的跑通，确认手感和真实需求，再上复杂的全功能平台。

反例：上来就装 OwnPilot/Orbis 全家桶 → 配置一堆、踩一堆坑 → 还没体验到价值就放弃
正例：先 Ollama + Open WebUI 跑通本地聊天（20 分钟）→ 确认值得 → 再加知识库/渠道/语音

哲学 2：本地与云端混合，不做二选一

纯本地（隐私好但模型弱）和纯云端（强但要钱、数据外流）都不是最优。混合才是甜点：

任务类型	走哪条线	为什么
日常闲聊、改写、翻译、总结	本地 Qwen3 30B	免费、隐私、够用
复杂推理、长链路 Agent、写代码	云端 Claude / GPT	2026 年本地模型在多步骤任务上仍明显弱

智能路由（cheapest / fastest / smartest）能自动在两者间切换，详见 02-architecture.md。

哲学 3：助理归助理，写代码归 Cursor

很多全功能助理都号称"能写代码"，但体验远不如专用 IDE。不要硬塞：

写代码 → Cursor（专业工具，主场）
私人助理 → 聊天、知识库、语音、多渠道

两件事拆开，各用最强的工具。

哲学 4：数据自己掌控，但接受模型走云端

"私人"的核心是对话历史、知识库、凭证都存在自己机器上。模型本身用云端 API 是可以接受的折中——因为 API 调用是无状态的，厂商不留你的知识库。

三、选型决策树

每一步都面临选择，下面是本次实践得出的"推荐路径"：

决策 1：部署在哪台设备？

你有能 7×24 常开的设备吗？
├── 有常开 Mac / 服务器 → 部署在它上面（推荐）
├── 只有笔记本但当台式用、不搬走 → 也可以（本次就是这种）
│        ⚠️ 注意防止合盖休眠，见 04 部署章
└── 笔记本经常带出门 → 考虑 $5/月 VPS，或用云端托管方案

这次我选：MacBook Pro M5 Pro / 48GB，当台式常开——配置足够同时跑本地模型和助理平台。

决策 2：要不要本地模型？

你在意 API 费用 / 隐私吗？48GB+ 内存能跑得动好模型。
├── 在意 + 硬件够 → 本地 + 云端混合（推荐）
├── 完全不在意、只要最省心 → 纯云端 API
└── 极度隐私敏感、可接受模型弱一些 → 纯本地

这次我选：混合——本地跑 Qwen3 30B 兜底日常，云端 Claude 处理硬任务。

决策 3：用哪个"门面"（界面 / 平台）？

你的主要需求是什么？
├── 就想要个好用的 ChatGPT 替代 + 知识库 → Open WebUI（推荐起步）
├── 主要是"和我的文档对话" → AnythingLLM
├── 要语音 + 多渠道 + 记忆的全功能助理 → OwnPilot / Orbis
└── 要可视化搭 Agent 工作流 → Dify

这次的路径：先 Open WebUI 起步（覆盖聊天 + 知识库 + 接云端模型），验证后再上 OwnPilot 补齐语音 + 多渠道。详见 03-toolchain.md。

决策 4：本地模型选哪个？

你的内容主要是中文吗？内存多大？
├── 中文为主 + 48GB → Qwen3 30B（推荐，中文强）
├── 偏代码任务 → Qwen3 Coder 30B
├── 要更快更省内存 → GPT-OSS 20B / Gemma 4
└── 16GB 小内存 → 7-8B 模型（Llama / Qwen 小杯）

这次我选：Qwen3 30B——48GB 内存能轻松跑，中文综合能力好。

决策 5：怎么远程访问？

你要在外面（不在家）也能用吗？
├── 要 → Tailscale（私有组网，最省心）或 Cloudflare Tunnel
└── 只在家里局域网用 → 直接 http://局域网IP:端口 即可

这次倾向：Tailscale——零配置、安全、手机也能连回家里的助理。

四、典型路径（如果一切顺利）

阶段 0  规划方案、写文档（当前所在）
        ↓
阶段 1  装 Ollama + 拉 Qwen3 30B（验证本地模型，30 分钟）
        ↓
阶段 2  装 Open WebUI，接本地模型 + 云端 Claude（聊天 + 知识库跑通）
        ↓
阶段 3  配 Tailscale，手机也能访问
        ↓
阶段 4  （可选）上 OwnPilot/Orbis 补齐语音 + Telegram 多渠道
        ↓
完成：一个自己掌控的、混合驱动的私人助理

五、典型坑（按出现顺序，先剧透）

详见各章，这里是简版预警：

笔记本合盖就休眠 → 助理掉线，需用 caffeinate 或电源设置防睡
Docker 里连不上宿主机 Ollama → 要用 host.docker.internal 而非 localhost
OpenAI 兼容端点要带 /v1 → http://localhost:11434/v1，不是裸地址
本地模型同时加载多个会爆内存 → 设 OLLAMA_MAX_LOADED_MODELS=1
微信没有官方个人 API → 多渠道先从 Telegram 起步，微信要绕路
全功能平台（OwnPilot/Orbis）较新 → 文档不全、偶发 bug，做好排错准备

六、什么时候不用这套方法论

你只是偶尔问问 AI → 直接用网页版 ChatGPT/Claude，别折腾自托管
没有能常开的设备、也不想买 VPS → 自托管价值大打折扣
完全不想碰命令行 / Docker → 用桌面应用 Jan.ai 或 AnythingLLM 桌面版

下一步

继续看 02-architecture.md，了解混合架构具体怎么搭。

01 · 整体概览：哲学与决策树 ​

一、目标与边界 ​

二、核心哲学 ​

哲学 1：先验证，再上重型方案 ​

哲学 2：本地与云端混合，不做二选一 ​

哲学 3：助理归助理，写代码归 Cursor ​

哲学 4：数据自己掌控，但接受模型走云端 ​

三、选型决策树 ​

决策 1：部署在哪台设备？ ​

决策 2：要不要本地模型？ ​

决策 3：用哪个"门面"（界面 / 平台）？ ​

决策 4：本地模型选哪个？ ​

决策 5：怎么远程访问？ ​

四、典型路径（如果一切顺利） ​

五、典型坑（按出现顺序，先剧透） ​

六、什么时候不用这套方法论 ​

下一步 ​