DeepSeek估值近700亿元 V4新版月底杀到:彻底摆脱英伟达转投华为芯片 连老黄都慌了

依依百科 百科资讯 2

4月18日消息,DeepSeek创始人梁文锋正准备开启其创业以来的首次融资。

这家此前一直坚持不融资的顶尖大模型公司,正计划以不低于100亿美元的估值,筹集至少3亿美元的资金,意在为竞争激烈的AI持久战储备充足的弹药。

在极其烧钱的AI大模型竞赛中,资金实力的厚度直接决定了技术上限。

除了筹集资金,DeepSeek还计划在月底推出备受瞩目的V4新版本。尽管此前该版本因各种原因多次推迟,但其采用的万亿参数MoE架构依然备受行业期待。

V4版本延续了DeepSeek效率优先的哲学,虽然总参数量高达1万亿,但每个token仅激活约370亿参数。这意味着其推理成本能与前代V3保持持平,这种极致的性价比设计一直是DeepSeek的核心竞争力。

据知情人士透露,V4延期的核心原因并非模型本身的技术瓶颈,而是一场极其复杂的底层硬件大迁移。过去DeepSeek的所有模型都基于英伟达芯片训练,但V4版本选择了一条完全不同的国产化道路。

据悉,DeepSeek V4将运行在华为最新的昇腾芯片上。

为了实现这一跨越,工程师们投入了大量精力解决芯片适配问题。他们不仅重写了核心代码,还完成了从英伟达CUDA生态向华为CANN架构的底层迁移。

这是一个重大的技术决策,更是一个极具冲击力的战略信号。DeepSeek此次并未给英伟达或AMD提供提前优化适配的机会,而是将早期访问权限独家开放给了国产芯片厂商。

如果V4能在国产硬件上跑出具备竞争力的性能,它将成为全球第一个不依赖英伟达硬件生态的前沿AI大模型。这种从软件到硬件的自主闭环,将标志着国产AI产业链的一次重大突破。

英伟达CEO黄仁勋对此也表达了忧虑。他在近期采访中直言,基于国产硬件平台的新模型对美国而言可能是一个糟糕的结果。他担心一旦顶尖AI模型被优化到在国产芯片上表现更好,英伟达多年构建的生态护城河将不再牢固。