华为云昇腾AI云服务正式上线，支持“百模千态”高效创新

浪*** · 发表于 2023-9-27 19:56:31

应用市场
在21日的演讲现场，张平安宣布，华为云昇腾AI云服务已正式上线，支持主流大模型在智能化时代“百花齐放”，做好“百花园”的黑土地。目前，所有企业可即刻在华为云官网上购买和使用昇腾AI云服务。

全智能时代，AI算力需求将迎来爆发式增长。华为预计，到2030年通用计算能力将增长10倍，AI计算能力将增长500倍。然而，由于AI服务器的功率密度远超通用服务器，单机柜功耗是传统机柜的6至8倍，并需专用液冷系统散热，且大模型训练需要百卡、千卡甚至万卡，服务器之间的互联、时延、可靠性、运维极为复杂，自建AI数据中心面临诸多挑战。

为更好支持大模型的“百模千态”创新，华为云在贵安、乌兰察布、芜湖打造了3大AI云算力中心，为企业提供澎湃昇腾AI算力，让企业再也不需要高价抢购GPU，也不需要担心GPU未来潜在的供应连续性挑战。

同时，华为云昇腾AI云服务百模千态专区已正式上线。企业和开发者可以直接使用业界主流的开源大模型，如LLAMA，GLM等。

在大模型训练数据安全方面，华为云采用了数据传输与存储加密、数据安全清除、数据访问控制、数据水印防泄露等多重技术，确保大模型训练数据的全生命周期安全。

此外，华为云还提供高效长稳的大模型训练环境和完备的工具链：实现千卡训练连续30天不中断，任务恢复时长小于30分钟；通过30多个可视化调优和部署工具，帮助企业更高效进行数据处理、模型微调、Prompt工程等，完成一个千亿参数的行业模型端到端开发，从过去需要5个月缩短到现在1个月，整体速度提升5倍。

系统性创新，构建AI时代最佳云底座

大模型重塑千行万业的背后，是众多复杂的技术挑战，需要核心技术的持续创新和突破。华为云以全局的系统性创新，不断攻坚克难，构建AI时代最佳云底座。

华为云CTO张宇昕在大会现场发表演讲表示，随着大模型能力涌现，多模态融合，MOE等趋势，模型参数将从现在的5400亿很快超过数万亿，对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求。同时，数据集规模的快速增长，数据高效存储、清洗和标注的难度，以及海量Token的训练等仍然具有挑战性。这些挑战相互影响、环环相扣，可以说，大模型及相关应用是迄今为止最复杂的软硬件系统工程。

为应对AI时代的挑战，华为云实现了软硬件结合的系统性创新：

在系统架构层，QingTian架构基于高速新型网络协议，打破算力、存储和网络的边界，实现多元算力的对等全互联，为客户提供最佳AI算力基础设施，实现超大规模的高性能AI算力。

基于QingTian架构，华为云昇腾AI云服务提供算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts，为大模型和AI应用的开发、运行提供最佳算力服务。

在数据处理层，华为云提供云上全流程一站式能力，包括数据存储、分析、共享、标注方案，让企业实现大模型数据“找得到”“存得下”“记得住”“用得了”。

在模型训练层，华为云通过盘古大模型的5+N+X的架构实现分层解耦，赋能千行万业，让每个行业、每个企业基于自己的场景都可以拥有自己的大模型。

在应用开发层，华为云整合了应用开发需要的开发生产线、低码/无码平台、AI应用框架及全新的AI应用工程套件，让客户轻松实现基于大模型的AI原生应用的零门槛构建。

同时，这些系统性创新的云服务能力，已经可以跨云、网、边、端等多平台，以及公有云，边缘云、混合云等多形态，实现灵活自由的部署和应用。对于建立自己专属AI平台和大模型的需求，企业可通过华为云Stack混合云平台，在数据中心部署昇腾AI云服务和大模型的关键产品，一站式建设专属大模型。会上，张宇昕正式发布华为云Stack 8.3，相关服务将于9月底全面上市商用。

张宇昕表示，华为云致力于系统性创新，构建AI时代最佳的云底座，用云的技术帮助行业攻坚克难。让云无处不在，让智能无所不及，共建智能世界云底座。

		自动登录	找回密码
密码			立即注册

[杂谈] 华为云昇腾AI云服务正式上线，支持“百模千态”高效创新

浏览过的版块

站长推荐 /1