DeepSeek V4将在未来数周内发布,或将完全运行于华为芯片

区块律动

BlockBeats 消息,4 月 4 日,据美国科技媒体 The Information 最新报道,中国 AI 初创公司 DeepSeek 即将发布的新一代旗舰模型 V4,将完全运行于华为自研芯片之上,被视为中国推动半导体自主化进程的重要里程碑。

V4 预计将在未来数周内发布,并将完全运行于华为芯片。DeepSeek 为此与华为及芯片设计商寒武纪合作数月,重新改写了模型底层部分代码,以实现与国产芯片的兼容。

值得注意的是,DeepSeek 这次并未向英伟达开放 V4 的提前测试权限,仅邀请国内芯片企业参与早期优化,打破了业界惯例。

阿里巴巴、字节跳动、腾讯等中国科技巨头已提前采购华为最新款 Ascend 950PR 芯片,总订单量达数十万颗,计划通过云服务部署 V4 并整合至自家 AI 应用。需求激增推动该芯片价格上涨约 20%。

V4 采用混合专家架构(MoE),总参数量约 1 万亿,每次推理激活约 370 亿参数,可在保持低延迟的同时支持文本、图像与代码的多模态输入。

去年 DeepSeek 发布低成本模型 V3 和 R1,曾引发全球科技股大跌,令市场质疑美国 AI 公司是否需要耗资数十亿美元采购算力。V4 因此备受国际关注。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论