分享好友 资讯首页 资讯分类 切换频道

DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持

2026-04-24 17:42江苏苏州 电信320快科技

4月24日消息,今日,DeepSeek正式上线V4预览版并宣布开源,该模型支持百万字超长上下文处理。

摩尔线程联合智源众智FlagOS社区宣布,在旗舰AI训推一体GPU MTT S5000上,完成对DeepSeek-V4-Flash大模型的Day-0极速适配,并实现全量核心算子深度优化与部署支持。

DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持

DeepSeek-V4-Flash采用MoE架构,总参数284B、激活参数13B,支持百万Token上下文,首次采用FP4+FP8混合精度,对算力芯片提出更高要求。

摩尔线程MTT S5000是国内率先原生支持FP8的全功能GPU,搭载硬件级FP8 Tensor Core,相比BF16/FP16可将显存压力降低50%,计算吞吐量翻倍。

DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持

本次适配由智源FlagOS完成FP8量化,团队聚焦FP8算子与Sparse Attention算子两大关键,通过两大方向实现突破:

一是依托FlagTree编译器做精细化shape对齐与矩阵计算加速;

二是通过FlagOS-Tune自动搜索最优内核配置,效果超越手工调优。实测显示,开启自动调优后TTFT时延降低16.5%,ITL时延降低39.7%,吞吐量提升65.7%。

DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持

目前,双方已完成DeepSeek-V4-Flash适配,并正在推进更大规模的DeepSeek-V4-Pro(1.6T)在MTT S5000上的迁移适配。

开发者可在魔塔、HuggingFace下载镜像开箱即用。


点赞 0
反对 0
举报
收藏 0
评论 0
分享 4
更多相关评论
暂时没有评论,来说点什么吧
美国一波音A321 NEO客机起飞时撞人 发动机起火!已致1死12伤
5月10日消息,据央视新闻报道,当地时间5月8日晚11时19分,美国边疆航空公司4345航班从丹佛国际机场起飞时,在17L跑道撞上一名闯

0评论2026-05-123

选择虚空还是圣光?微星RTX 5070魔兽世界至暗之夜联名显卡评测:设计精致性能强劲 陪你继续征战艾泽拉斯
一、前言:最实用的游戏周边《魔兽世界》最近上线了最新的资料片:至暗之夜,版本也来到了12.0,在内容地图玩法更新的同时,游戏

0评论2026-05-123

今晚8点开抢!京东天猫618超级红包来袭 最高26888元
一年一度的 618 购物狂欢即将拉开帷幕,最让人期待的无门槛红包福利也准时上线!5 月 12 日 20:00,京东京享红包、天猫 618 超级

0评论2026-05-125

母亲节两个老公文案惹争议!OPPO再致歉:高管被问责 连降两级
5月11日消息,据国内媒体报道,就母亲节不当文案一事,OPPO今日内部正式发布问责通告,对相关责任人进行了定级处罚。其中,OPPO

0评论2026-05-124