In progress

Synapse

把个人笔记变成可以检索、引用和对话的长期记忆系统。

Case Study

从问题、受众到当前状态。

FastAPIReact NativeQdrantOllamaOpenAI-compatible API

问题

普通笔记工具能保存内容，但很难在需要时重新组织上下文；AI 工具能生成回答，却容易缺少来源、隐私边界和长期记忆。

受众

需要长期积累工程判断、产品想法、研究笔记和个人上下文的独立开发者与知识工作者。

当前状态

当前主线已经覆盖 FastAPI 后端、笔记处理、RAG 检索、Qdrant 向量、模型路由、隐私检测和引用式对话，后续继续补同步、移动端输入和知识图谱。

System map

输入层：移动端和 Web UI 负责低摩擦记录、编辑和查询。

服务层：FastAPI 组织认证、笔记、搜索、对话、同步和成本统计。

AI 层：根据隐私级别、任务类型、长度和预算在本地模型与云端模型之间路由。

数据层：关系数据库保存结构化记录，Qdrant 负责语义召回，Redis 承担缓存和限流。

Decisions

高敏感内容默认走本地模型，云端调用必须经过隐私、成本和熔断判断。

对话结果要能回到原始笔记，否则它只是一次生成，不是一个可信的记忆系统。

先让输入、处理、检索、引用和对话跑通，再继续加知识图谱、主动提醒和数字分身能力。

Evidence

形成了 4 篇连续工程复盘文章，覆盖愿景、RAG、模型路由和引用上下文。

把 Synapse 从概念整理成可讨论的系统边界，适合作为后续产品路线图。

沉淀出个人知识系统的一组长期主题：隐私、召回、证据、同步和上下文治理。

Reading path

离线优先同步移动端输入体验知识图谱可视化基于引用质量的回答评估

AI / Engineering / Product

我复盘 Synapse 的初衷与架构：从零摩擦输入、自动整理、语义检索、对话式查询，到本地优先的模型路由、隐私边界和数字分身愿景。

AI / Engineering / RAG

把 RAG 从 demo 推到可用系统时，最容易踩的 6 个坑：chunk 切分、检索不准、上下文污染、token 预算、本地模型、latency。结合 Synapse 的真实取舍给出可操作解法。

AI / Engineering / Product

结合 Synapse 当前代码，复盘模型路由的真实实现：隐私分级、本地优先阈值、对话云端优先、失败降级、运行时配置、心跳探测和成本记录。

AI / Engineering / RAG

继续复盘 Synapse 的真实实现：笔记后台处理、关键词搜索、Qdrant note 级向量、对话上下文拼装、citations，以及下一步要补的 chunk 与重排。