2023年大模型时代的危与机报告

今天分享的是:2023年大模型时代的危与机报告

报告共计:38页

《2023年大模型时代的危与机报告》由复旦大学张奇撰写,主要探讨了大模型时代自然语言处理(NLP)面临的情况,包括大模型的认知、对NLP研究与应用的影响、面临的挑战与机遇等。

大模型认知

1. 数据需求:语言模型预训练后仍需大量标注数据,如OpenAI雇佣大量承包商进行数据标注工作。

2. 能力涌现:所谓能力涌现可能是评价指标问题,其具有敏锐性和不可预测性,但将度量换成线性/连续的,性能提升是平滑、连续且可预测的。大模型在推理能力上仍有待提高,且并非所有场景都需千亿大模型,小模型在某些任务上也有优势。

3. 本质能力:ChatGPT等大模型本质上是基于大量数据的文字接龙,展现出超强文本建模、多任务统一学习和任务泛化等能力。

大模型对NLP的影响

1. 工作流程转变:小模型时代任务开发成本高、周期长,大模型时代工作流程简化,新任务可快速训练且无需重新部署,能低成本产品化。

2. 应用场景广泛:在银行领域有信贷辅助决策、公司债业务审核、智能客服、企业知识库建设等多场景应用,涉及多种NLP技术。

3. 研究重点变化:从单个小任务研究转向一类问题统一框架研究,包括领域大模型、模型可控文本生成、隐私、鲁棒性、推理能力、可解释性等方面,同时关注超小规模任务模型构建及与因果机制融合等,中文开源大模型族发展也受关注。

大模型面临的挑战与机遇

1. 挑战:大模型时代存在赢者通吃现象,对话交互方式使先发优势明显,追赶代价大。

2. 机遇:推动NLP从手工作坊向工业化转变,带来如面向B端私有化部署“小”模型等机遇,不同业务类型可根据自身需求利用大模型解决相应问题,如长距离建模、统一任务建模、领域和任务泛化等,但多数情况仍依赖训练数据。大模型构建需要好的基础语言模型、足够的任务训练数据和合适的训练方法。

以下为报告节选内容

返回搜狐,查看更多

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()