DeepSeek-V4双版本开源,中文AI迎来“长脑时刻”

2026年4月24日,深度求索公司以一场“轻发布、重开源”的方式,正式推出DeepSeek-V4预览版。没有冗长的发布会,没有夸张的渲染,只在官网和GitHub上同步更新了一行关键信息:全系列标配100万token超长上下文,即日起MIT协议开源。

DeepSeek-V4双版本开源,中文AI迎来“长脑时刻”

这或许是2026年国产大模型领域最“不声张”却最具分量的动作之一。

双版本齐发:一个“封顶”,一个“普惠”

DeepSeek-V4共发布两个版本——Pro版与Flash版,分别对应顶级性能与极致性价比。

Pro版总参数达到1.6万亿,单token实际激活490亿参数。在Agent任务、世界知识问答和复杂推理链评测中,官方披露其综合表现已超越此前国内所有开源模型,并在多项国际基准上进入第一梯队。更具工程意义的是,Pro版在长文档理解、多轮工具调用等场景下表现出远超预期的稳定性。

Flash版则显得“轻盈”许多:总参数2840亿,激活130亿参数。其定位清晰——用接近Pro版的推理能力,换取更低的部署门槛和调用成本。深度求索内部测试显示,在主流长文本任务上,Flash版的输出质量与Pro版差距已缩小至可感知边缘,而单次推理的成本不足Pro版的十分之一。

两个版本均采用了新型混合注意力架构。该架构的核心突破在于:在处理百万token级输入时,计算复杂度和显存占用量均出现断崖式下降。据技术报告披露,相较于传统全注意力机制,混合注意力在不损失召回精度的前提下,可将长序列推理的显存峰值降低60%以上。

DeepSeek-V4双版本开源,中文AI迎来“长脑时刻”

“1M上下文,从此是标配”

发布中最具标志性的一句话来自深度求索官方声明:“从现在开始,1M上下文将是DeepSeek所有官方服务的标配。”

此前,百万级上下文虽不时被各家模型作为“秀肌肉”的卖点,但往往伴随高昂的API定价、有限的接入渠道或复杂的切片策略。DeepSeek此次将之固化为全系标配,并配合MIT协议完全开源——意味着个人开发者、中小团队乃至高校实验室,都可以在本地部署一个拥有百万token“内存”的大模型。

有开源社区开发者评论:“这就像突然把内存条从512MB换到了64GB,过去写RAG、做文档处理的所有思路都要重新想。”

DeepSeek-V4双版本开源,中文AI迎来“长脑时刻”

开源与商业化:一条更深的护城河

深度求索同时开放了API服务。Pro版定价暂未公开,但Flash版预览期间提供大幅折扣额度。值得注意的是,MIT协议意味着任何人可以复制、修改甚至商用该模型,深度求索不收取任何授权费用。

在各大厂商纷纷收紧模型协议、限制二次分发的当下,DeepSeek-V4的全面开源显得近乎“叛逆”。然而,这并非不计成本的理想主义——通过开源占据开发者心智、借Flash版构建低成本调用习惯、再以企业级服务形成闭环,已成为深度求索明确的战略路径。

正如其内部一位核心工程师在社交平台上所言:“我们相信,大模型真正的护城河不是模型本身,而是有多少人在上面真正用起来了。”

DeepSeek-V4双版本开源,中文AI迎来“长脑时刻”

普惠时代开启,悬念仍在

DeepSeek-V4预览版的上线,至少解决了中文开源大模型在超长上下文领域的“有无”问题。但真正的考验才刚刚开始:百万token能否在实际应用中被稳定、高效地使用?Flash版的性能承诺能否经得起社区复现?Pro版能否在后续正式版中继续拉开代差?

这些问题,或许要等到开发者真正把代码跑起来的那一天,才会有答案。

无论如何,2026年4月24日,已经被写入中文AI开源史。这一天,百万上下文不再是少数人的奢侈品,而变成了所有人的默认配置。

文章内容仅供参考,不构成投资建议,投资者据此操作风险自负。转载请注明出处:远视互动

(0)
远视财商远视财商
上一篇 2026-04-22 下午1:20
下一篇 2025-02-14 上午11:28

相关推荐

  • 宁德时代“极域之约”:6分27秒充98%,1500公里续航改写电动出行

    在全球新能源汽车产业进入成熟发展的关键阶段,一场围绕能源解决方案的深层变革正在动力电池领域悄然展开。4月21日,国内电池龙头企业宁德时代举办了一场科技发布会,不仅展示了多项技术创新成果,更揭示了行业竞争规则的演变趋势——从单纯追求电池性能参数,转向构建涵盖材料研发、补能网络和制造体系的综合生态能力。 材料创新:构建多元技术矩阵 本次发布会的核心亮点当属第三代神行超充电池。此外,宁德时代宣布已攻克钠离子电池规模化制造的技术瓶颈。官方数据显示,这款钠离子电池实现了等效10C、峰值15C的极限充电速率。在常温实测条件下,从10%电量充至98%仅需6分27秒。这意味着,未来搭载该电池的电动汽车,补能效率已基本与燃油车加油时间持平。这一进展为市场提供了重要的技术补充,其显著的低温性能和资源优势有望拓宽电动汽车的应用边界。 在提升充电速度的同时,宁德时代也没有忽视续航里程的终极追求。全新发布的麒麟凝聚态电池首次将航空级技术应用于乘用车领域,能量密度大幅提升。官方宣称,搭载该电池的轿车综合续航里程可达1500公里。与此同时,在能量密度领域,该公司也取得了突破性进展。最新推出的凝聚态电池技术,首次将航空领域验证过的解决方案应用于高端电动车,实现了电芯质量能量密度350Wh/kg的行业新水平,为长续航电动车的安全与性能平衡提供了新的技术路径。 补能体系:从单点突破到网络构建 随着电动汽车普及率的持续提升,用户的关注重点正从“续航长短”转向“补能体验”。对此,宁德时代展示了一套系统性解决方案。在电芯层面,新一代快充技术不仅实现了快速补能,还通过材料创新和热管理系统优化,确保了电池在长期快充使用下的健康度,解决了“充电速度”与“电池寿命”难以兼顾的行业痛点。 在基础设施层面,该公司提出了创新的“超换一体”服务模式,将快速充电与换电服务有机结合起来。根据规划,宁德时代将携手合作伙伴,构建覆盖主要城…

    2026-04-22 科技
  • 2026北京亦庄人形机器人半程马拉松:一场极限工况下的技术检阅

    2026年4月19日,北京亦庄的清晨被一种特殊的节奏唤醒。当一万两千名人类跑者的呼吸声与心跳声在起点汇集时,另一群沉默的竞赛者也已就位——它们的胸腔没有心跳,关节转动的声音取代了粗重的喘息。发令枪响,一场看似平常的半程马拉松,悄然变成了观察未来技术走向的独特棱镜。 智能的成年:当机器开始为自己“看路” 赛道第一个复杂弯道处,工程师们的目光紧紧追随着那些无人遥控的身影。与去年绝大多数机器人需要人类“手把手”引导不同,今年有超过百台参赛机器凭借自身的“眼睛”和“大脑”前行。它们头顶的激光雷达像谨慎的触角,不断扫描前方路面起伏与障碍物;内置处理器则在毫秒间解算着最优的步伐序列与重心轨迹。 赛事组委会那个精妙的设计——自主完成者按实际用时排名,而遥控操作者的成绩需乘以1.2的系数——如同一根无形的指挥棒,清晰地指向了技术进化的下一个路口:真正的实用价值,必然建立在独立应对真实世界复杂性的能力之上。当一台机器能自主判断如何在湿滑弯道调节步频、如何在人群间隙中安全穿行,它才初步具备了走入人类生活场景的“入场券”。 躯体的革命:突破钢铁之躯的生理极限 荣耀团队那台名为“闪电”的机器人在冲过终点时,看台上爆发出的惊呼不仅为了冠军,更为那个惊人的数字:50分26秒。这比当时人类保持的世界纪录快了近七分钟。在惊叹速度的背后,是材料科学、热力学与机械工程协同突围的故事。 “闪电”体内那套精密的液冷循环网络,如同为钢铁躯体装上了一套“血液循环系统”。在长达二十多公里的持续高强度驱动中,电机与减速器产生的热量被快速带走,避免了性能衰减与故障。这是从“短跑冲刺”到“耐力长跑”的本质跨越。另一边的宇树H1则展现了轻量化设计的魅力,47公斤的体重下实现了10米/秒的瞬时爆发,其高扭矩关节电机提供了媲美职业运动员的蹬地力量。 松延动力的工程师在谈及他们的“小顽童”时,提到了一个朴素的指标:现在只需要两块电池…

    2026-04-21 科技
  • 从舞台到车间:CITE 2026上的机器人“变形记”

    如果你今年4月9号到11号去了深圳会展中心,走进第十四届中国电子信息博览会(CITE 2026)的现场,你可能会发现一个有意思的现象:那些往年被围得水泄不通、放着动感音乐秀翻跟头的机器人展台,这回反而没那么热闹了。真正让人群挪不动脚的,是另一类看起来有点“笨拙”的家伙——它们正老老实实地拧螺丝、搬零件、叠衣服,甚至帮病人抬胳膊做康复。 这届展会来了1200家全球电子领域的公司,摆出了5000多件新产品,什么芯片、AI手机、自动驾驶、AI看病,样样都有。但最让业内人士津津乐道的,是具身智能机器人身上那股“烟火气”——它们不再为了博眼球而表演,而是开始认认真真地干活了。 观众口味变了:不看花活看实效 “前两年客户一来就问,你家机器人能翻几个跟头?今年倒好,开口就是‘它能替我干点啥’。”一个参展商苦笑着跟我吐槽。这句话其实道出了整个行业的转向:大家受够了那些只会跳舞的“玩具”,现在要的是能进工厂、进家庭的真家伙。 工厂里的新工友:拧螺丝比翻跟头吃香 在工业展区,好多公司都拿出了双臂协作机器人。这些东西看着不咋起眼,但干起活来一点不含糊——靠高精度的力觉传感器和视觉系统,它们能精准地把电子元件插到电路板上,还能整理乱成一团的线束。以前这些活儿都得靠熟手工人,现在机器人也能干了。深圳有家本土企业更狠,直接在现场让机器人在移动平台上自动分拣零件、码放整齐,一套流程下来行云流水,吸引了一堆专业观众围着拍照。 家里来了新帮手:扫地叠衣服都在行 服务机器人也没闲着。一款主打家庭清洁的人形机器人,不再只会模仿人的动作,而是能自己规划扫地路线,看到地板和瓷砖还会自动切换清洁模式。另一款商用机器人专门盯着餐厅传菜和收碗碟,它的多层托盘和避障算法都是根据真实餐馆环境调出来的,据说已经在不少连锁店里试用了。 跨界混搭:车里和医院里也有它们的身影 智慧出行和AI医疗这两个领域也没落下。有的车企把具身智能…

    2026-04-18 科技
  • DeepSeek上线专家模式:当大模型“深度专注”,AI推理迎来新范式

    近日,深度求索公司为DeepSeek模型推送了一项名为“专家模式”的重要更新。这一升级并非简单扩充参数量或拉长上下文窗口,而是从注意力机制层面重构了大模型处理复杂问题的逻辑——让AI从“通才式泛化应答”转向“深度专注式推理”。对技术社区而言,这或许预示着大模型能力竞争的一条新赛道。 技术内核:动态注意力锚定如何实现“去噪” 专家模式的核心突破在于引入动态注意力锚定机制。标准Transformer架构中,模型会对输入的所有token进行全局注意力计算,这导致回答高难度专业问题时,大量无关的常识性信息会混入推理路径,形成“思维杂音”。DeepSeek团队在注意力层前增加了一个可学习的“专注度门控单元”。该单元在推理阶段实时评估每个token对当前子任务的信息增益预期:当某条知识分支的关联度低于动态阈值时,门控单元会主动切断该注意力分支,将算力全部集中到高价值推理链上。 从工程实现角度看,这一机制无需修改模型底层权重,而是通过一个轻量级适配器实现。用户开启专家模式后,模型会临时调用一套独立的注意力掩码矩阵,其参数由数千个经过标注的“专注推理”样本微调得到。这种方法既保留了基础模型的通用能力,又能在需要时快速切换至“深度专注”状态。 性能实测:逻辑密度与准确率的双重跃升 在内部基准测试中,专家模式展现出显著的行为差异。以一道国际数学奥林匹克级别的组合数学问题为例,标准模式下DeepSeek的回答平均包含约1200个token,其中穿插了基本概念解释、多种思路的试探性分析以及最终结论;开启专家模式后,输出精简至480个token,直接进入核心引理的推导与证明,且最终答案的正确率从标准模式的67%提升至89%。在代码漏洞分析任务中,专家模式能够忽略代码中与漏洞无关的格式化注释和冗余函数,将注意力精准锚定在指针操作和内存分配区域,误报率下降了42%。 更值得关注的是专家模式与外部知识库的…

    2026-04-14 科技
  • 折叠屏“诸神之战”!一文看懂四款热门机型谁能更胜一筹

    随着横向折叠屏技术步入成熟发展期,过往两年已成为各品牌展开“巅峰对决”的关键窗口。当前备受关注的四款旗舰折叠机型——华为Mate X6、荣耀Magic V5、vivo X Fold5和三星Galaxy Z Fold7,已彻底摆脱早期“秀技术”的定位,全面转向日常高频使用。接下来,我们将围绕机体结构与握持感、屏幕与折痕表现、影像系统实力以及智慧交互生态四个核心方面展开剖析。 一、结构与手感:在轻薄与耐用之间寻找最优解 在机身控制方面,荣耀Magic V5再次巩固了其轻薄领域的优势。采用新一代硅碳负极电池与定制铰链,素皮版成功将重量压缩至225克附近,展开后机身厚度控制出色,近似于直板机手感。vivo X Fold5也在这一代实现了显著瘦身,通过内部结构简化,重量进入230克区间,保留无线快充能力的同时,其特殊后盖材质增强了抗污耐磨性。 华为Mate X6采取了均衡策略,重量约240克,但其创新的“分布式玄武架构”提升了整体结构强度,摄像头区域在折叠状态下呈现协调的秩序感,整体设计偏向商务与稳重风格。三星Galaxy Z Fold7在轻量化方面步伐相对审慎,虽然铰链手感依旧细腻、悬停体验精准,但整机重量仍在250克左右,并且屏幕折痕在特定光线下仍相对可察。 二、屏幕与折痕:视觉体验与可靠性的双重考验 在屏幕视觉平整度上,华为Mate X6和荣耀Magic V5均展现出高水准。二者采用的水滴型铰链方案,在屏幕点亮时折痕控制出色,手指触摸时仅有细微起伏感。vivo X Fold5的铰链调校兼顾顺滑手感与悬停稳定性,整体表现扎实。 三星Z Fold7延续U型铰链设计,历经多次迭代,在开合质感与机械精密感上依然独具特色。其在折痕视觉控制上的取舍,部分源于对高等级防水与整体强度的兼顾,侧视角度仍可见一定凹陷。 三、影像表现:从全场景覆盖到专项突破 影像系统在这一代折叠旗舰上得到普遍加强。…

    2026-04-08 科技
  • 荣耀Magic V6:体系化创新能否重新定义折叠屏全能标杆?

    随着折叠屏手机在高端市场的影响力日益增强,关于谁才是折叠屏领域的领跑者的讨论,已经超越了简单的参数比拼,进入了产品理念与技术路线深度较量的新阶段。时至2026年,一款能被冠以最佳之名的折叠屏手机,并非仅仅依靠某个单项优势的突出,而是如同荣耀Magic V6这般,从底层逻辑上重塑了优秀的标准。 纵观折叠屏技术的发展脉络,其演进轨迹清晰可辨:最初阶段重在探索形态的可能性,中期致力于弥补基础体验的不足,而到了今天,有资格角逐折叠屏王者的产品,必须在多个核心体验维度上均达到卓越水准。荣耀Magic V6的独特之处,在于它并未孤注一掷地强化某个单一特性,而是凭借体系化的工程实力,将折叠屏从一种特殊形态的装置,真正转变为用户能够信赖的日常主力设备。 这一转变首先渗透在日常的握持与使用感受中。荣耀Magic V6极大地淡化了折叠结构带来的物理存在感,展开时机身厚度仅为4.0毫米,折叠后控制在8.75毫米左右,整体重量约219克。这使得用户在绝大多数使用场景中,几乎察觉不到它与传统直板手机之间的界限。这种弱化形态差异的设计哲学,有别于过去一味强调展开即得平板的体验导向,更贴近真实、高频的用户习惯,也让当代折叠屏标杆的内涵,不再局限于一块更大的屏幕,而是一部足以长期担当主力角色的成熟产品。 更深层的变化体现在电池技术与机身结构的精妙协同上。以往的折叠屏产品往往需要在轻薄机身与持久续航之间艰难权衡,而荣耀Magic V6借助新一代青海湖电池技术与内部架构的革新,成功实现了约7000mAh的大容量电池与轻薄机身的和谐共存。这不仅是电池容量的简单增加,更重要的是它扭转了用户对折叠屏续航能力的固有认知——从需要时刻关注电量转变为可以放心全天使用。在这一关键领域,荣耀Magic V6已不仅仅是弥补短板,而是在为整个行业树立新的续航基准,这也是其争夺折叠屏旗舰头衔的核心依据之一。 在性能释放策略上,荣耀…

    2026-03-31 科技

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注