DeepSeek、豆包向左，盘古大模型向右

华为的盘古大模型终于推出新版本了。

6月20日华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线，盘古大模型5.5同步发布。

不过，当前国内的AI大模型竞争可谓是相当激烈，华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从一众强敌面前杀出重围？

强敌环伺

今天，我们的AI大模型与美国Open AI、谷歌等科技公司的大模型已经相差不大，甚至在某些领域已经反超。

一类是由互联网科技巨头开发的大模型，如阿里巴巴开发的通义千问、字节跳动开发的豆包大模型、百度开发的文心一言4.0、科大讯飞开发的星火大模型、腾讯开发的元宝等。通义千问中文理解能力全球领先，支持百万级上下文窗口和多模态交互；豆包大模型月活用户量第二，擅长图像理解和多模态融合。

另一类是由DeepSeek、Kimi为代表的创业公司大模型。DeepSeek就不用说了，如今也是国内最火的大模型，月活用户量高达1.8亿，妥妥的一哥；Kimi由月之暗面开发，支持20万汉字输入，长文本处理能力突出，适合数据分析与专业文档解读，同样受到了不少用户的欢迎。

华为作为国内的科技巨头，虽然有着相当强劲的AI实力，但盘古大模型要从如此众多的竞争对手中杀出重围，也不是一件容易的事。

国产大模型普遍向左，盘古大模型偏偏向右

不管是DeepSeek也好，还是豆包大模型也罢，大多数的国产大模型几乎都选择了面向C端用户。不过盘古大模型则偏偏选择了To B，他们选择深耕行业，赋能千行百业，推动产业智能化升级。

在工业领域，盘古预测大模型通过优化生产工艺和系统寻优，提升生产效率，如海螺集团利用盘古大模型实现熟料强度预测，准确率超过85%，降低能耗；在农业领域，盘古大模型帮助农业科学家改良水稻株型，提高抗倒伏能力，同时保持产量，实现精准农业。

展开全文

在金融领域，盘古金融大模型提供精准的风险评估和客户服务，提升金融机构的运营效率和客户满意度；在政务领域，盘古政务大模型助力政府提供智能化服务，提高政务处理效率和透明度。

在医疗领域，盘古医学大模型加速医学研究，提供精准诊断和治疗建议，推动医疗科技进步；在能源领域，盘古大模型优化能源生产和分配，如云南铝业通过坤安大模型降低电耗，实现节能减排。

在自动驾驶领域：盘古多模态大模型生成高质量训练数据，加速自动驾驶技术发展，如广汽集团与华为云合作实现高效数据生成；在机器人领域，盘古世界模型为具身智能机器人提供数字物理空间，提升操作能力，如火星车避障训练。

在过去的一年中，盘古大模型持续深耕行业，在政务、制造、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值，重塑千行万业。此番重磅推出的盘古大模型5.5，同样继续深耕行业，推动各行业的数智化转型与升级。

盘古大模型5.5，内功究竟几何？

打磨了整整一年的时间，盘古大模型终于迎来了升级版。不得不说，盘古大模型是真沉得住气。那么，我们就来看看盘古大模型5.5打磨了这么长时间，究竟有着怎样的实力。

此次发布的5.5版本，包括比肩全球一流大模型的718B准万亿级NLP深度思考大模型、基于盘古多模态大模型的世界模型、升级的预测大模型、升级的视觉大模型，以及科学计算大模型。

算力支持方面。新一代AI云服务基于CloudMatrix 384超节点的新一代昇腾AI云服务，提供强大算力支持，单卡推理吞吐量提升近4倍，算力有效使用率提升50%以上。

技术性能方面。盘古大模型5.5采用256个专家组成的MoE架构，大幅增强了知识推理、工具调用和数学计算能力，通过自适应快慢思考合一技术，实现推理效率提升8倍，能够根据问题难度智能切换推理速度，兼顾效率与准确性。

创新特性方面。盘古多模态大模型可生成数字物理空间，为智能驾驶、具身智能机器人训练提供大量数据，降低训练成本，提高效率。

行业应用方面。盘古大模型在30多个行业、500多个场景中落地，包括政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等，发挥巨大价值。

总体看来，从技术实力的角度来看，华为盘古大模型5.5确实是一款先进的AI模型。

技术也是一把双刃剑

盘古大模型5.5可能太在乎对技术的追求了，但它也忽视了技术也是一把双刃剑。任何事情都是有利有弊，有好的一面也有不好的一面。

盘古大模型5.5拥有庞大的参数规模，如盘古Ultra MoE模型参数高达7180亿，这导致其在训练过程中需要消耗大量的计算资源和存储资源，从而使得训练成本较高。

与此同时，盘古大模型5.5采用了许多先进的技术和架构，如MoE架构、自适应快慢思考合一技术等。这些技术的复杂性可能会增加模型开发和调试的难度，同时也对开发人员的技术水平提出了更高的要求。

此外，盘古大模型5.5基于华为的昇腾AI云服务和鲲鹏CPU等硬件进行训练和推理，这种依赖性可能限制了其在非华为硬件平台上的部署和运行。

最后，还有一个不能忽视的问题，那便是数据安全问题。大模型训练需要大量的中文语料库，这可能会涉及到用户隐私和数据安全问题。尽管华为采取了相应的保护措施，但数据安全仍然是一个需要持续关注和优化的方面。

总体来看，国产大模型与ChatGPT等国外先进大模型的差距是越来越小了。在DeekSeek、盘古大模型等国产大模型的共同推动下，必然会推动中国式AI走出一条独特发展的道路。

扫一扫打开手机网站

微信扫一扫关注我们

DeepSeek、豆包向左，盘古大模型向右

作者: wczz1314

发表回复取消回复

联系我们

微信扫一扫关注我们

给这篇文章的作者打赏

作者: wczz1314

为您推荐

摩尔线程、沐曦三年巨亏超80亿，“中国英伟达”们争夺GPU芯片第一股｜深读

让充电宝上不了飞机的“致命电芯”，到底是谁？

暗访3C贴纸黑市：5元包邮3C标，4万毫安时充电宝贴张纸秒变2万毫安时容量

大厂暗战高考志愿填报，谁是张雪峰平替？

小扎官宣Meta超级智能实验室！97年小孩哥带队，11人名单7位是华人

曝华为将在9月发布三折叠改款 还有耳夹耳机、手表等

发表回复 取消回复

联系我们

微信扫一扫关注我们

曝华为将在9月发布三折叠改款还有耳夹耳机、手表等

发表回复取消回复