当前位置:首页 > 热点关注 > 正文内容

DeepSeek提到的FP8到底是啥 引发AI圈热议

1周前 (08-22)热点关注25

   DeepSeek提到的FP8到底是啥 引发AI圈热议!DeepSeek V3.1发布后,一则官方留言在AI圈引起轰动。短短不到20个字的留言中提到新的架构和下一代国产芯片,信息量巨大。受此影响,国产芯片企业的股价纷纷上涨,例如寒武纪早盘盘中大涨近14%,总市值跃居科创板头名。半导体ETF也在半天内大涨5.89%。

  

   许多人对UE8M0 FP8这一概念感到困惑。UE8M0 FP8可以拆分为两部分解释。UE8M0是MXFP8路径中的“缩放因子”,而MXFP8是Open Compute Project在2023年发布的8 bit微缩块格式。Open Compute Project是一个由Facebook(现Meta)、英特尔、Rackspace等发起的开源硬件协作计划,旨在通过共享数据中心及服务器设计推动行业效率提升。其成员包括微软、谷歌、亚马逊、AMD、英伟达以及国内的阿里、腾讯、百度等公司。

  

   MXFP8基于FP8建立,将常规浮点格式压缩到8 bit。MXFP8的核心思想是将张量切成固定长度的“块”,为每个块指定一个2的整数次幂作为“缩放因子”,然后将块内所有数值除以这个系数后再写成FP8。这种块级的缩放方式保留了8 bit位宽,同时扩展了可用动态范围。UE8M0中的U表示无符号,E和M分别代表指数位和尾数位分配到的bit数。UE8M0指8个bit全部分配给了指数位。

   采用全指数表示缩放因子的方式有多个好处热点话题。首先,处理器在根据缩放因子复原数据时只需移动指数位,无需进行浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。此外,UE8M0的动态范围覆盖2^(−127)到2^128,为后续块缩放提供了充足空间。它还能解决单尺度FP8无法同时处理大/小值的问题,减少了信息损失。

  

   UE8M0 FP8更适配“下一代国产芯片”。目前,大部分已量产的国产AI加速器仍使用FP16/BF16 + INT8计算通路,未集成完整的FP8乘加单元。但摩尔线 NPU等新款国产芯片已在宣传资料中列出“原生 FP8”或“Block FP8”支持,并与多家厂商联合验证UE8M0格式。虽然下一代国产芯片在HBM/LPPDDR带宽方面仍有差距,但UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统FP32节省75%流量,成为重要优化方向。DeepSeek提到的FP8到底是啥 引发AI圈热议 DeepSeek提到的FP8到底是啥 引发AI圈热议

相关文章

中国女排主帅:信心来源于平日积累 点滴铸就辉煌

   4月28日,新一届中国女排进行了一堂公开训练课。刚刚上任的主帅赵勇表示,只有直面困难和挑战才能铸就辉煌,信心来源于每天点滴的积累。他认为,中国女排在任何时候都经历了许多挑战和困难,在...

万科A:一季度营收近380亿,公开债如期兑付

万科A:一季度营收近380亿,公开债如期兑付

   4月29日,万科企业股份有限公司发布2025年第一季度报告。一季度,万科实现营业收入379.9亿元,合同销售金额近350亿元,并且一季度公开债全部如期兑付。   ...

海关查获泡泡玛特玩偶318个 代购谋利被暂扣

   4月24日,长沙黄花机场海关在对一入境航班进行监管时,发现3名入境旅客行李物品机检图像高度一致,且未向海关申报。经开箱查验,从行李物品中查获泡泡玛特玩偶共318个。旅客表示携带这些物...

哮喘“四问” 北京协和医院专家解读哮喘的误区与真相 揭开哮喘四大疑问

哮喘“四问” 北京协和医院专家解读哮喘的误区与真相 揭开哮喘四大疑问

   4月30日,国家卫生健康委召开新闻发布会。北京协和医院主任医师支玉香针对哮喘的常见问题进行了详细解答。   ...

江西已开启人海模式 “五一”出游人气旺

江西已开启人海模式 “五一”出游人气旺

   “五一”假期,江西迎来了旅游热潮。不少知名景区开启了“人山人海”模式,江西省博物馆和美术馆都挤满了游客。在八一广场,来自全国各地的游客和市民朋友齐聚一堂,共同见证五星红旗冉冉升起,感...

美国黄石公园附近发生撞车事故致7死 旅游团遭遇不幸

美国黄石公园附近发生撞车事故致7死 旅游团遭遇不幸

   当地时间5月2日,美国爱达荷州警方报告称,5月1日晚上7点15分左右,在爱达荷州东部黄石国家公园附近发生了一起交通事故,一辆皮卡与一辆旅游面包车相撞,导致7人死亡。...