Phase 3:向量存储与检索
本阶段目标:把 Phase 2 的 Document 列表写入向量库,学会 Embeddings、VectorStore、Retriever 的用法,并能用自然语言查询得到相关 chunk。
1. 设计指导
1.1 概念关系
* Embeddings:文本 → 向量。LangChain 用 Embeddings 接口封装(如 OpenAIEmbeddings)。
* VectorStore:存 (vector, metadata, optional id),支持相似度搜索。本项目用 Chroma 做本地开发(无需额外服务),生产可用 Qdrant。
* Retriever:抽象「查询 → 返回相关 Document 列表」