盘古大模型

3个月前发布 141 0 0

华为旗下的超大规模AI大模型，集成了华为云团队在AI领域数十项研究成果。

收录时间：

2025-08-09

打开网站手机查看

开发编程 # 盘古大模型

盘古大模型

打开网站

盘古大模型是华为旗下的超大规模AI大模型，集成了华为云团队在AI领域数十项研究成果，并与昇腾（Ascend）芯片、昇思（MindSpore）语言、ModelArts平台深度结合。
一、发展历程
立项与初期合作：2020年11月，盘古大模型在华为云内部立项成功，并完成了与合作伙伴、高校的合作搭建。
正式对外发布：2021年4月，盘古大模型正式对外发布。
持续升级：随后几年，盘古大模型经历了多次升级。例如，2023年7月7日，在华为开发者大会上，面向行业的盘古大模型3.0正式发布，这是中国首个全栈自主的AI大模型。
最新发布：2024年6月21日，在华为开发者大会（HDC 2024）上，华为常务董事、华为云CEO张平安发布了盘古大模型5.0，该版本在全系列、多模态、强思维三个方面带来了全新升级。

二、模型架构
盘古大模型采用“5+N+X”三层架构：

L0层：包括5个基础大模型，涵盖自然语言（NLP）、视觉（CV）、多模态、预测、科学计算等领域。
L1层：N个行业通用大模型，是在L0基础上导入行业数据进行训练而衍生，如矿山大模型、政务大模型、气象大模型等。
L2层：X个场景模型，是在L1基础上结合行业细分场景得到的推理模型，如传送带异物检测、台风路径预测等具体应用场景。L2层为用户提供了更多细化场景的模型，支持用户自主训练。

三、主要特点
全系列模型：盘古大模型5.0包含不同参数规格的模型，如十亿级、百亿级、千亿级、万亿级等，以适配不同的业务场景。
多模态能力：能够理解和处理包括文本、图片、视频、雷达、红外、遥感等多种模态的信息，提供更为丰富和精准的AI服务。在内容生成方面，采用业界首创的STCG（Spatio Temporal Controllable Generation，可控时空生成）技术，可生成更加符合物理规律的多模态内容。
强思维能力：将思维链技术与策略搜索深度结合，极大地提升了数学能力、复杂任务规划能力以及工具调用能力。
高效生成能力：能够生成高质量的文本、图像、语音等，满足多种应用场景的需求。
多语言支持：支持多种语言，能够进行跨语言交流和翻译。

四、应用场景
盘古大模型已在多个行业和场景中落地应用，发挥了巨大价值。例如：

政务与公共服务：通过强大的自然语言处理能力，提升政府服务的智能化水平，如智能助手、数据分析等。
工业与制造业：推动生产流程的智能化和自动化，如质量检测、生产优化等。
气象预测：实现气象预报精度首次超过传统数值方法，速度提升1000倍，提供秒级天气预报。
医疗健康：为疾病诊断和治疗提供新的技术手段，如药物研发等。
自动驾驶：通过创新的可控时空生成技术，结合场景视频生成等技术，加速自动驾驶技术的快速成熟。
建筑设计：基于可控生成能力，快速生成建筑群360°实景视频和3D模型。

五、技术进展与创新
模型训练与优化：依托昇腾的算力和盘古大模型的结合，HarmonyOS NEXT拥有了系统级AI能力。在数据合成方面，采用weak2strong方法，通过迭代式的合成高质量的数据，提升了数据的利用率，并激活了模型中的更多能力。
模型架构升级：提出了昇腾亲和的Transformer架构——创新的π新架构，解决了特征坍塌问题，并通过增广残差连接的方法，提升了模型的精度。
统一视觉编码器：将不同领域的编码器能力蒸馏到统一视觉编码器中，提升了编码效率，特别是在文档理解能力上有显著提升。
动态分辨率：通过尺度泛化的训练范式，动态递增的方式帮助盘古5.0在动态分辨率的表征上超过了业界同等模型的能力。

六、产业影响与挑战
华为盘古大模型作为AI领域的重要里程碑，对促进AI工业化具有深远影响。它通过与各行业合作伙伴的深入合作，进一步拓展应用场景和影响力，推动多个行业的数字化转型和智能化升级。同时，盘古大模型也面临着数据隐私保护、模型安全可控等挑战。

数据统计

盘古大模型

数据统计

相关导航

Augment Code

n8n

Tabby

Cursor

通义灵码

PyTorch

aiXcoder

GitHub Copilot

标签云