问题
普通笔记工具能保存内容,但很难在需要时重新组织上下文;AI 工具能生成回答,却容易缺少来源、隐私边界和长期记忆。
Case Study
问题
普通笔记工具能保存内容,但很难在需要时重新组织上下文;AI 工具能生成回答,却容易缺少来源、隐私边界和长期记忆。
受众
需要长期积累工程判断、产品想法、研究笔记和个人上下文的独立开发者与知识工作者。
当前状态
当前主线已经覆盖 FastAPI 后端、笔记处理、RAG 检索、Qdrant 向量、模型路由、隐私检测和引用式对话,后续继续补同步、移动端输入和知识图谱。
System map
01
输入层:移动端和 Web UI 负责低摩擦记录、编辑和查询。
02
服务层:FastAPI 组织认证、笔记、搜索、对话、同步和成本统计。
03
AI 层:根据隐私级别、任务类型、长度和预算在本地模型与云端模型之间路由。
04
数据层:关系数据库保存结构化记录,Qdrant 负责语义召回,Redis 承担缓存和限流。
Decisions
高敏感内容默认走本地模型,云端调用必须经过隐私、成本和熔断判断。
对话结果要能回到原始笔记,否则它只是一次生成,不是一个可信的记忆系统。
先让输入、处理、检索、引用和对话跑通,再继续加知识图谱、主动提醒和数字分身能力。
Evidence
Reading path
AI / Engineering / Product
我复盘 Synapse 的初衷与架构:从零摩擦输入、自动整理、语义检索、对话式查询,到本地优先的模型路由、隐私边界和数字分身愿景。
AI / Engineering / RAG
把 RAG 从 demo 推到可用系统时,最容易踩的 6 个坑:chunk 切分、检索不准、上下文污染、token 预算、本地模型、latency。结合 Synapse 的真实取舍给出可操作解法。
AI / Engineering / Product
结合 Synapse 当前代码,复盘模型路由的真实实现:隐私分级、本地优先阈值、对话云端优先、失败降级、运行时配置、心跳探测和成本记录。
AI / Engineering / RAG
继续复盘 Synapse 的真实实现:笔记后台处理、关键词搜索、Qdrant note 级向量、对话上下文拼装、citations,以及下一步要补的 chunk 与重排。