今天分享的是:2023年大模型时代的危与机报告
报告共计:38页
《2023年大模型时代的危与机报告》由复旦大学张奇撰写,主要探讨了大模型时代自然语言处理(NLP)面临的情况,包括大模型的认知、对NLP研究与应用的影响、面临的挑战与机遇等。
大模型认知
1. 数据需求:语言模型预训练后仍需大量标注数据,如OpenAI雇佣大量承包商进行数据标注工作。
2. 能力涌现:所谓能力涌现可能是评价指标问题,其具有敏锐性和不可预测性,但将度量换成线性/连续的,性能提升是平滑、连续且可预测的。大模型在推理能力上仍有待提高,且并非所有场景都需千亿大模型,小模型在某些任务上也有优势。
3. 本质能力:ChatGPT等大模型本质上是基于大量数据的文字接龙,展现出超强文本建模、多任务统一学习和任务泛化等能力。
大模型对NLP的影响
1. 工作流程转变:小模型时代任务开发成本高、周期长,大模型时代工作流程简化,新任务可快速训练且无需重新部署,能低成本产品化。
2. 应用场景广泛:在银行领域有信贷辅助决策、公司债业务审核、智能客服、企业知识库建设等多场景应用,涉及多种NLP技术。
3. 研究重点变化:从单个小任务研究转向一类问题统一框架研究,包括领域大模型、模型可控文本生成、隐私、鲁棒性、推理能力、可解释性等方面,同时关注超小规模任务模型构建及与因果机制融合等,中文开源大模型族发展也受关注。
大模型面临的挑战与机遇
1. 挑战:大模型时代存在赢者通吃现象,对话交互方式使先发优势明显,追赶代价大。
2. 机遇:推动NLP从手工作坊向工业化转变,带来如面向B端私有化部署“小”模型等机遇,不同业务类型可根据自身需求利用大模型解决相应问题,如长距离建模、统一任务建模、领域和任务泛化等,但多数情况仍依赖训练数据。大模型构建需要好的基础语言模型、足够的任务训练数据和合适的训练方法。
以下为报告节选内容