DeepSeek的“冰与火”:开源热闹,R2迟到
网络 09-24
日前,DeepSeek 官方发布 V3.1-Terminus 版本更新,称针对用户反馈提升了模型稳定性与一致性,消息一小时内获 “10w+” 关注。但市场热议背后,新一代推理模型 R2 的再度缺席引发失望,距 R1 发布已 246 天,相关传言达 10 次却始终未落地。
2025 年初,R1 以卓越推理能力及开源姿态惊艳行业,却也推高市场预期。从 2 月传言 “5 月初发布”,到 5 月泄露 “1.2 万亿参数” 等细节,再到 9 月彭博社称 “四季度发布”,反复传言耗损用户耐心,而阿里通义千问、百度文心等竞品已完成多轮迭代。
延迟背后是三重困境:算力迁移遇阻,从英伟达转向华为昇腾生态的技术难题拖慢进度;资本与市场的高期待让团队对发布决策慎之又慎;国内外竞争加剧挤压战略空间。
虽 R2 缺位,DeepSeek 同步构建开源生态,推出多款低成本模型及工具链,适配昇腾平台形成生态循环。但技术短板凸显:多模态能力薄弱,文生图模型反响平淡;依赖外部数据致 R1 频现 “幻觉”,缺乏自有内容生态支撑。
当前,梁文锋需在 “技术完美” 与 “市场时机” 间抉择。DeepSeek 的困境实为国产 AI 企业缩影,其 R2 最终发布及破局路径,将为行业提供重要参考。
评论
发表评论
暂无评论
相关推荐