0121
2026-01-21 17:14:07

DeepSeek新模型“MODEL1”代码曝光

出海网1月21日消息,在DeepSeek-R1发布一周年之际,其新模型“MODEL1”的项目标识符在GitHub开源社区的FlashMLA代码库中曝光,与现有模型DeepSeek-V3.2并列出现。行业分析指出,“MODEL1”在键值缓存布局、稀疏性处理及FP8数据格式解码支持等关键技术层面与现有架构存在差异,表明其可能是全新设计的模型,推测已接近训练完成或推理部署阶段。尽管业内对其定位存在不同猜测——可能是V4旗舰模型、推理模型R2或是V3系列终极版,但此次代码更新印证了此前DeepSeek将于2月发布新一代模型的传闻。值得注意的是,DeepSeek近期发布的两篇技术论文介绍了“优化残差连接”训练方法和受生物学启发的“AI记忆模块”,新模型有望整合这些最新研究成果。与此同时,Hugging Face发布周年博客指出DeepSeek-R1已成为其平台获赞最多的模型,中国开源模型全球影响力显著提升,深度嵌入全球AI供应链。

下一篇菲律宾警方拘捕5名中国籍人士 查获160万比索未注册饮料产品
出海网1月21日消息,菲律宾国家警察于周一在邦板牙省圣西蒙镇一处仓库展开执法行动,拘捕5名中国籍人士,并查获价值约160万比索的未注册饮料产品。警方指出查获产品包括逾1000箱能量饮料及超过3000箱巧克力牛奶饮品,总值约161.9万比索,均未向菲律宾食品药品管理局注册,涉嫌非法生产及分销。此次行动基于线报,执法人员确认该仓库疑似在无许可情况下从事规模化食品制造与流通,对公众健康构成潜在风险。警方表示另有一名涉案人员仍在逃,追捕与调查工作持续进行。涉案中国籍人士将面临违反《菲食品安全法》、《菲律宾移民法》等指控,当局呼吁公众购买食品饮料时核查FDA注册信息,避免购买来源不明产品。
免费下载
免费下载
小程序
小程序
小程序
交流群
交流群
交流群
回顶部