您的位置 首页 科技

全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持

地址:https://docs.nvidia.com/cuda/parallel-thread-execution/#mma-scaling-kind-type-valid-combination

全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持

地址:

https://docs.nvidia.com/cuda/parallel-thread-execution/#mma-scaling-kind-type-valid-combination

UE8M0 fp8 并不是 DeepSeek 独创

至少从 PTX 8.0/9.0(对应 Hopper/Ada 架构 GPU)开始,NVIDIA 已经在 ISA 级别支持 .ue8m0

它就是 NVIDIA 官方 scale 数据格式之一,用在 FP8/FP4 混合精度量化的场景

NVIDIA Hopper 架构 (H100 系列)

H100 GPU(2022 年发布),面向数据中心和 AI 训练/推理,是 首个官方支持 FP8 (E4M3 / E5M2) 混合精度 的 GPU 架构,在 PTX 指令里引入了 .ue8m0 作为 scale data type。

NVIDIA Ada Lovelace 架构 (RTX 40 系列)

RTX 4090 / 4080 / 4070 等消费级显卡(2022 年底发布),面向游戏和 AI 推理。同样在底层指令集里继承了 .ue8m0、E4M3/E5M2 的支持。

也就是说技术上:UE8M0 已经在 NVIDIA 硬件生态存在

全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持

因此个人觉得DeepSeek 这句话应该这么理解

这相当于DeepSeek V3.1 把原本只在硬件/内核实现层面存在的 scale 表达方式,提升到模型部署和训练标准,适配了国产下一代芯片,但DeepSeek的确是在走别人没走过的路

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://jvto.cn/42680.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部