阿里云AI搜索RAG大模型优化实践
报告共计:32页
《欧明栋:阿里云AI搜索RAG大模型优化实践》介绍了阿里云在AI搜索RAG大模型方面的优化实践。首先阐述RAG背景,包括大模型知识问答存在的外在幻觉等问题及不同方式的效果对比。接着介绍RAG架构及效果问题归因,如文档解析及切片、Query理解与检索服务、LLM等方面可能导致幻觉、拒答、回答不完整等问题。强调RAG效果关键点在于大模型、文档解析、切片语义、信息召回和推理总结等方面的准确。
在优化实践中,包括RAG架构 - 大模型优化,如检索信息不完整时的处理;介绍RAG模块架构,涉及组件编排、多种SDK、搜索组件、数据层等内容。还探讨文档结构化及切片问题,提出语义层级抽取模型,介绍其数据增强、模型训练方法,以及语义层级切片的相关研究。
此外,讲述大模型微调与Agent探索,指出大模型生成存在幻觉等问题,介绍效果评测方法,阐述大模型微调的样本筛选等操作及模型效果,对比不同模型在各场景的表现。针对RAG场景复杂问题提出Agentic RAG,分析其效果与挑战。最后介绍RAG应用实践,包括电商、教育搜题等典型场景,以及基于阿里云AI搜索开发平台的客户场景实践,如离线文档结构化、切片与索引,在线Agent的应用等。
以下为报告节选内容
责任编辑: