Skip to content

05 · 案例与项目:别人怎么搞的

动手前多看几个真实实践,少踩坑。本章是精选的实践文章 + 高星 GitHub 项目清单。


一、实践案例文章(看别人怎么搭)

强烈推荐:真实复盘类

文章亮点链接
A 9-Layer AI System Built With Ollama on a Mac Mini M4在 Mac mini / 16GB 上搭了 9 层本地 AI 系统(聊天+自主编码+Mac/浏览器自动化),有架构、失败教训、"什么真正有用"——最接近"私人助理"完整形态的复盘Towards AI
How to Build a Local AI Personal Assistant in 2026Ollama + DeepSeek + Open WebUI + Chroma 向量库,含 RAG 与系统提示词设计,第一个用例选"文档问答"验证全栈StackNova

macOS 本地部署类

文章亮点链接
Free Local AI Assistant on macOS (Ollama)10 分钟在 Mac 上跑通本地助理,含注册为 launch agent 后台常驻、API 调用Nick Launches
Open WebUI + Ollama on Mac: Local AI for Your Home Network怎么按硬件选模型、Open WebUI 局域网共享给家人,含内存占用对照famstack.dev
How to Connect OpenCode to Ollama本地代码 Agent:Ollama + OpenCode,强调 OpenAI 兼容端点要带 /v1CodeHelper

自托管 / 服务器部署类

文章亮点链接
Self-Hosted AI — Deploy Ollama and Open WebUI in Your Homelab完整 Docker Compose、GPU 加速、备份、Cloudflare Tunnel / Tailscale 远程访问GnTech Blog
Ollama + Open WebUI Self-Hosting Guide 2026两条路径:Mac 本地 5 分钟版 + Hetzner VPS(~$5/月)24/7 版,含"何时该直接用 API"的诚实建议Effloow
Deploy Open WebUI + Ollama on VPSVPS 部署 + Nginx 反代 + HTTPS + 集成云端模型SelfVPS

选型对比类

文章亮点链接
AnythingLLM vs Open WebUI vs LibreChat in 2026三大自托管界面深度对比,含 star 数、上手难度、各自的"坑"DEV Community
The Best Open Source AI Tools You Can Run on Your Own HardwareOllama / Open WebUI / Jan / AnythingLLM / Tabby / n8n 一览表 + 选型建议opensourcealternatives.to

二、GitHub 项目清单(按角色分类)

模型运行引擎(底座,必装)

项目说明
ollama/ollama~139k本地模型运行的事实标准,一条命令拉模型,OpenAI 兼容 API。本次方案的本地底座

聊天界面 / 知识库(门面 · 轻量型)

项目说明
open-webui/open-webui~141k最流行的自托管 AI 界面,ChatGPT 式 UI + RAG + TTS/STT + 多用户 + 插件。本次起步首选
Mintplex-Labs/anything-llm~60k文档 RAG 优先,桌面 App 零配置,适合"和我的文档对话"
menloresearch/jan纯本地桌面 App,零订阅、最易上手
danny-avila/LibreChat~36k多 provider + 企业认证(LDAP/SSO),栈较重

全功能助理(门面 · 重型)

项目说明
ownpilot/OwnPilot140+ 模型供应商、MCP、语音、智能路由、Telegram/WhatsApp。混合路由场景最契合,本次进阶候选
orbis-agent/orbis语音 + 6 渠道 + 知识图谱 + 安装向导,单租户。进阶备选
OpenClaw(搜最新仓库)50+ 集成、能自写技能、7×24 自主。⚠️ 早期有安全事故,务必用新版 + 沙箱

路由 / 编排 / 自动化(底座 · 进阶)

项目说明
BerriAI/litellm统一各家 API + 智能路由 + 用量统计,想做成本控制时用
langgenius/dify可视化搭 RAG / Agent 工作流,连本地和云端模型
n8n-io/n8n通用自动化 + AI 节点,接一堆外部服务
TabbyML/tabby自托管代码补全(Copilot 替代),但本次写代码仍用 Cursor

三、本地模型选择参考

模型拉取命令大小适合
Qwen3 30Bollama pull qwen3:30b~18-20GB中文强、综合好,本次首选
Qwen3 Coder 30Bollama pull qwen3-coder:30b~18GB偏代码任务
GPT-OSS 20Bollama pull gpt-oss:20b~12GB更快更省内存
DeepSeek-V3(量化)看 Ollama 库需 36GB+ 内存
nomic-embed-textollama pull nomic-embed-text~300MB知识库嵌入(必拉)

模型迭代快,拉之前到 ollama.com/search 看当下最新版本号。


四、阅读建议路径

没时间只看 1 篇   → Towards AI 那篇 9 层系统复盘(最完整)
想动手照着做     → Effloow 自托管指南(Mac + VPS 两条路)
纠结选哪个界面   → AnythingLLM vs Open WebUI vs LibreChat 对比
想了解 RAG 细节  → StackNova 本地助理那篇

五、待回流(部署后补充)

自己实践后,把真实踩的坑、性能数据、最终配置记录到这里,让这份 playbook 持续进化。

  • [ ] Qwen3 30B 在 M5 Pro 上的实际 token/s
  • [ ] Open WebUI 接 Claude 的具体端点配置
  • [ ] 知识库喂了哪些文档、检索效果如何
  • [ ] OwnPilot 是否上了、语音/Telegram 体验如何
  • [ ] 每月云端 API 实际花了多少钱

返回

回到 首页 · 上一章 04-deploy.md

私人 AI 助理部署方法论 · 部署于 Cloudflare Pages