Chengshuo Dai

大模型总是胡说八道（幻觉问题）真的让人很头疼。今天学习了 RAG（检索增强生成），感觉这是目前最靠谱的解决方案。

RAG 的思路其实特别像开卷考试。当用户提问时，系统先去本地的知识库里搜索相关的文档片段，然后把这些片段连同用户的问题一起扔给大模型，让它“根据参考资料回答”。

听起来很简单对吧？但我发现实际做起来全是坑。比如 Chunking（文本分块）策略：如果切得太大，会包含太多无关信息，干扰模型；如果切得太小，又会丢失上下文。还有怎么处理表格、怎么处理跨段落的指代，感觉全都是细碎的工程问题。

读到了一篇关于 Advanced RAG 的文章，里面提到了很多进阶技巧，比如 Query Rewriting（把用户的口语化提问改写成更适合检索的关键词）。文章里说："The quality of your RAG system is bounded by the quality of your retrieval."

确实，如果搜出来的东西就是错的，大模型再聪明也没用。感觉 RAG 系统的核心其实不在大模型，而是在传统的搜索和信息检索技术上。