|
应用市场
在21日的演讲现场,张平安宣布,华为云昇腾AI云服务已正式上线,支持主流大模型在智能化时代“百花齐放”,做好“百花园”的黑土地。目前,所有企业可即刻在华为云官网上购买和使用昇腾AI云服务。
全智能时代,AI算力需求将迎来爆发式增长。华为预计,到2030年通用计算能力将增长10倍,AI计算能力将增长500倍。然而,由于AI服务器的功率密度远超通用服务器,单机柜功耗是传统机柜的6至8倍,并需专用液冷系统散热,且大模型训练需要百卡、千卡甚至万卡,服务器之间的互联、时延、可靠性、运维极为复杂,自建AI数据中心面临诸多挑战。
为更好支持大模型的“百模千态”创新,华为云在贵安、乌兰察布、芜湖打造了3大AI云算力中心,为企业提供澎湃昇腾AI算力,让企业再也不需要高价抢购GPU,也不需要担心GPU未来潜在的供应连续性挑战。
同时,华为云昇腾AI云服务百模千态专区已正式上线。企业和开发者可以直接使用业界主流的开源大模型,如LLAMA,GLM等。
在大模型训练数据安全方面,华为云采用了数据传输与存储加密、数据安全清除、数据访问控制、数据水印防泄露等多重技术,确保大模型训练数据的全生命周期安全。
此外,华为云还提供高效长稳的大模型训练环境和完备的工具链:实现千卡训练连续30天不中断,任务恢复时长小于30分钟;通过30多个可视化调优和部署工具,帮助企业更高效进行数据处理、模型微调、Prompt工程等,完成一个千亿参数的行业模型端到端开发,从过去需要5个月缩短到现在1个月,整体速度提升5倍。
系统性创新,构建AI时代最佳云底座
大模型重塑千行万业的背后,是众多复杂的技术挑战,需要核心技术的持续创新和突破。华为云以全局的系统性创新,不断攻坚克难,构建AI时代最佳云底座。
华为云CTO张宇昕在大会现场发表演讲表示,随着大模型能力涌现,多模态融合,MOE等趋势,模型参数将从现在的5400亿很快超过数万亿,对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求。同时,数据集规模的快速增长,数据高效存储、清洗和标注的难度,以及海量Token的训练等仍然具有挑战性。这些挑战相互影响、环环相扣,可以说,大模型及相关应用是迄今为止最复杂的软硬件系统工程。
为应对AI时代的挑战,华为云实现了软硬件结合的系统性创新:
在系统架构层,QingTian架构基于高速新型网 络协议,打破算力、存储和网 络的边界,实现多元算力的对等全互联,为客户提供最佳AI算力基础设施,实现超大规模的高性能AI算力。
基于QingTian架构,华为云昇腾AI云服务提供算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts,为大模型和AI应用的开发、运行提供最佳算力服务。
在数据处理层,华为云提供云上全流程一站式能力,包括数据存储、分析、共享、标注方案,让企业实现大模型数据“找得到”“存得下”“记得住”“用得了”。
在模型训练层,华为云通过盘古大模型的5+N+X的架构实现分层解耦,赋能千行万业,让每个行业、每个企业基于自己的场景都可以拥有自己的大模型。
在应用开发层,华为云整合了应用开发需要的开发生产线、低码/无 码平台、AI应用框架及全新的AI应用工程套件,让客户轻松实现基于大模型的AI原生应用的零门槛构建。
同时,这些系统性创新的云服务能力,已经可以跨云、网、边、端等多平台,以及公有云,边缘云、混合云等多形态,实现灵活自由的部署和应用。对于建立自己专属AI平台和大模型的需求,企业可通过华为云Stack混合云平台,在数据中心部署昇腾AI云服务和大模型的关键产品,一站式建设专属大模型。会上,张宇昕正式发布华为云Stack 8.3,相关服务将于9月底全面上市商用。
张宇昕表示,华为云致力于系统性创新,构建AI时代最佳的云底座,用云的技术帮助行业攻坚克难。让云无处不在,让智能无所不及,共建智能世界云底座。
|
|