2025年1月31日,金融界报道,北京国电通网络技术有限公司(以下简称“国电通”)成功申请了一项名为“大型语言模型训练方法及相关设备”的专利。这一专利的公开号为CN119378662A,申请日期为2024年9月,标志着国电通在AI技术领域的又一重要进展。
国电通的这项专利主要解决了当前大型语言模型(LLM)训练中面临的设备资源限制问题。随着人工智能,尤其是自然语言处理(NLP)技术的迅速发展,如何高效地训练大型模型成为了研究者和企业普遍关注的热点。根据专利摘要,该方法通过将大型语言模型的编码器分解为多个子模型,并将这些子模型部署在不同的设备集群上,与服务器进行协同训练,从而实现流水线并行处理数据。这种创新的编码器块分割机制,使得数据处理效率大幅提升,同时也能够在确保用户数据隐私的前提下,克服设备资源的瓶颈。
国电通的这一技术创新不仅体现了其在AI领域的前瞻性,也为各类企业实现智能化转型提供了新思路。在实际应用中,这种基于分布式设备的训练方式,不仅可以显著减少对单一计算资源的依赖,还能更好地布局云计算和边缘计算资源,通过灵活的设备组合,满足不同规模的企业需求。特别是在当前信息安全日益受到重视的环境下,该方法的隐私保护特性尤为重要。
成立于2000年的国电通,注册资本达到73000万人民币,作为一家以专业技术服务为主的企业,近年来在技术创新和知识产权方面不断发力。据天眼查数据显示,该公司目前具有885条专利信息,涵盖多个技术领域。同时,国电通参与的招投标项目已经达到1903次,展现出其在行业中的活跃度和影响力。
随着AI应用的普及,特别是如ChatGPT等大型语言模型在各领域中的应用,市场对高效训练和用户隐私的需求也愈发迫切。国电通的这项专利不仅为自身发展奠定了技术基础,同时也为整个产业链的优化和发展提供了参考。通过该技术,企业可以在保持敏捷性的同时,提升AI模型的训练速度与效能,进而推动更加智能化的商业模式落地。
展望未来,国电通的这一专利可能会推动更多企业在大型语言模型的开发和应用上进行 创新探索,也许未来会涌现出更多类似的分布式训练技术,进一步提升AI的应用范围和实用性。随着技术的进步,AI不再只是科技公司的专属,而是将逐步深入到各行各业的日常运作中,改变人们生活和工作的方式。对于这一发展趋势,社会各界应给予更多关注,以合作的态度和开放的心态,共同迎接AI带来的契机与挑战。
解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → → https://ai.sohu.com/pc/textHome?trans=030001_jdaidzkj