2023年大模型时代的危与机报告_数据_训练

今天分享的是：2023年大模型时代的危与机报告

报告共计：38页

《2023年大模型时代的危与机报告》由复旦大学张奇撰写，主要探讨了大模型时代自然语言处理（NLP）面临的情况，包括大模型的认知、对NLP研究与应用的影响、面临的挑战与机遇等。

大模型认知

1. 数据需求：语言模型预训练后仍需大量标注数据，如OpenAI雇佣大量承包商进行数据标注工作。

2. 能力涌现：所谓能力涌现可能是评价指标问题，其具有敏锐性和不可预测性，但将度量换成线性/连续的，性能提升是平滑、连续且可预测的。大模型在推理能力上仍有待提高，且并非所有场景都需千亿大模型，小模型在某些任务上也有优势。

3. 本质能力：ChatGPT等大模型本质上是基于大量数据的文字接龙，展现出超强文本建模、多任务统一学习和任务泛化等能力。

大模型对NLP的影响

1. 工作流程转变：小模型时代任务开发成本高、周期长，大模型时代工作流程简化，新任务可快速训练且无需重新部署，能低成本产品化。

2. 应用场景广泛：在银行领域有信贷辅助决策、公司债业务审核、智能客服、企业知识库建设等多场景应用，涉及多种NLP技术。

3. 研究重点变化：从单个小任务研究转向一类问题统一框架研究，包括领域大模型、模型可控文本生成、隐私、鲁棒性、推理能力、可解释性等方面，同时关注超小规模任务模型构建及与因果机制融合等，中文开源大模型族发展也受关注。

大模型面临的挑战与机遇

1. 挑战：大模型时代存在赢者通吃现象，对话交互方式使先发优势明显，追赶代价大。

2. 机遇：推动NLP从手工作坊向工业化转变，带来如面向B端私有化部署“小”模型等机遇，不同业务类型可根据自身需求利用大模型解决相应问题，如长距离建模、统一任务建模、领域和任务泛化等，但多数情况仍依赖训练数据。大模型构建需要好的基础语言模型、足够的任务训练数据和合适的训练方法。

以下为报告节选内容

2023年大模型时代的危与机报告