在科技创新日益激烈的今天,上海交通大学最近推出的满血版DeepSeek系统吸引了广泛关注,成为国内高校在大模型自主创新领域的一项里程碑。这是基于华为昇腾Atlas 800 TA2算力集群的本地化部署,标志着该校成为全国首个实现千亿级大模型全栈国产化的高等学府。
此次部署涵盖了DeepSeek系列的多个核心模型,如DeepSeek-R1和DeepSeek-V3,旨在于教学、科研、管理和服务等多个场景中发挥作用。这一成果的背后,得益于昇腾架构所提供的卓越性能和公司技术支持团队的全力协助。
在技术创新方面,上海交大实现了三项重大突破:首先是轻量化推理架构,通过昇腾Ascend核心间通信优化技术,仅需4台Atlas 800服务器就能承载DeepSeek-R1和DeepSeek-V3的千亿参数推理,从而将硬件投资成本压低了65%。其次,动态资源调度得以实现,基于昇腾AI原生算力平台,可以更灵活地分配算力资源,提升其利用率。最后,技术重心放在自主可控,从昇腾计算处理器到MindSpore框架的深度适配,极大提升了在复杂数学推理任务中的效率,拉近了与传统方法的时延差距。
值得一提的是,2025年2月4日,DeepSeek-V3、DeepSeek-R1及Janus-Pro将正式上线华为昇腾社区,用户只需一键即可获取。这意味着,上海交通大学的师生们从今往后将能够随时畅享“满血”版DeepSeek,解决了以往“深度思考用不了”的烦恼。同时,鲲鹏昇腾科教创新卓越中心也将在课程设计和科研创新等方面推动DeepSeek的应用,积极探索人工智能赋能下的新型学习与科研模式。
鲲鹏昇腾科教创新卓越中心的建立,意味着一个基于鲲鹏昇腾技术的校级生态合作平台正式启航。未来,中心将在校企合作和产教融合屡次发挥关键作用,继续推动DeepSeek系列AI创新成果在高校环境中的应用,进一步渗透到师生的学习、生活和科研之中,助力上海交大在全球科技竞争中抢占先机。返回搜狐,查看更多