找回密码
 立即注册
搜索
日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿 马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

3 国产算力芯片打开千亿市场:“FP8精度”意味着什

[XinWen.Mobi 原创复制链接分享]
xinwen.mobi 发表于 2025-8-27 00:22:18 | 显示全部楼层 |阅读模式
“FP8精度”在国产算力芯片打开千亿市场的进程中具有重要意义,它是一种8位浮点数表示法,在AI计算领域优势显著。具体如下:提升算力效率:相比传统的FP16,FP8通过压缩数据宽度,将算力效率提升至翻倍水平。例如寒武纪思元590芯片在FP8适配后,推理效率提升高达300%。在相同的硬件条件下,支持FP8的Tensor Core可以在相同时间内进行更多次的浮点运算,加快训练和推理的速度。降低内存占用和功耗:FP8的数据位宽更窄,8位数据移动能耗仅为FP16的1/4,显存占用可减少50%-75%,这有助于解决AI数据中心的高能耗问题,也使得在相同功耗下,AI芯片能够训练更大的模型或显著缩短训练时间。促进模型优化和压缩:FP8的使用促使模型在训练和推理过程中进行量化,这有助于模型的优化和压缩,进一步降低部署成本。与INT8相比,FP8在LLM的训练和推理更有优势,因为它有更宽的动态范围,更能精准捕获LLM中参数的数值分布。推动国产算力芯片生态建设:DeepSeek发布的R1推理模型以及后续的DeepSeek-V3.1采用FP8精度,带动了国产算力芯片的适配以及生态协同,许多本土芯片厂商围绕DeepSeek开展合作,共同打造适配本土芯片的软件栈、工具链等生态组件,打破了国产芯片生态建设的僵局。增强国产算力芯片竞争力:FP8精度使得国产芯片在推理应用阶段性价比和可用性大增,在制程受限的背景下,为国产芯片提供了“软硬协同”的破局之道。同等算力下,国产推理芯片单价仅为英伟达H20的40%,吸引了更多行业采用国产芯片,推动国产芯片市场份额的提升。
回复

使用道具 举报

日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿·马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

QQ|标签|爬虫xml|爬虫txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-11-4 13:59 , Processed in 0.067822 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表