RAG:给大模型装上外接大脑
•RAG
大模型总是胡说八道(幻觉问题)真的让人很头疼。今天学习了 RAG(检索增强生成),感觉这是目前最靠谱的解决方案。
RAG 的思路其实特别像开卷考试。当用户提问时,系统先去本地的知识库里搜索相关的文档片段,然后把这些片段连同用户的问题一起扔给大模型,让它“根据参考资料回答”。
听起来很简单对吧?但我发现实际做起来全是坑。比如 Chunking(文本分块)策略:如果切得太大,会包含太多无关信息,干扰模型;如果切得太小,又会丢失上下文。还有怎么处理表格、怎么处理跨段落的指代,感觉全都是细碎的工程问题。
读到了一篇关于 Advanced RAG 的文章,里面提到了很多进阶技巧,比如 Query Rewriting(把用户的口语化提问改写成更适合检索的关键词)。文章里说:"The quality of your RAG system is bounded by the quality of your retrieval."
确实,如果搜出来的东西就是错的,大模型再聪明也没用。感觉 RAG 系统的核心其实不在大模型,而是在传统的搜索和信息检索技术上。