DeepSeek-V3.2-Exp模型开源发布重磅消息
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
界面新闻记者 | 朱咏玲界面新闻编辑 | 楼婍沁 香水集团颖通控股在上市后着力发展自有渠道品牌。 该公司近日在香港发布《2025港澳香氛市场发展趋势白皮书》,该白皮书的核心结论是,如今香氛产业正从“感官愉悦”向“情绪健康核心需求”转型。 颖通控股由此表示,为把握住“情绪健康”的市场...
当下,中国新能源汽车市场正经历前所未有的结构性变革。从早期的“价格战”到如今的“价值战”,行业竞争已从量的扩张转向质的提升。 在这一关键转型期,车企与华为的深度合作已不再是偶然,而是成为行业新趋势。从问界到智界,从享界到尊界,华为与汽车品牌的联姻已从简单的"技术赋能"升级为战略级的深度融合。...
9月25日,在2025京东全球科技探索者大会(JDD)上,京东集团SEC副主席、京东集团CEO许冉现场宣布大模型品牌Joy AI正式升级,并发布了购物和生活助手“京犀”、万能数字人助手“他她它”和附身智能应用“JoyInside”。...
9月26日,宇树科技创始人、CEO王兴兴在第四届全球数字贸易博览会上发言称,宇树科技机器人算法今年已经历几次迭代,预计下半年将发布身高1.8米的人形机器人。 王兴兴表示,今年上半年国内机器人行业发展火热,中国智能机器人相关企业平均增长率达50%到100%。前段时间宇树科技再次更新了算法,使机器...
2025年9月26日,“孕妇泰国坠崖案”当事人、电影《消失的她》原型王暖暖(化名)与俞某冬离婚案在江苏省南京市秦淮区人民法院开庭审理。历经4个小时开庭后,王暖暖对媒体透露,离婚案还没有明确结果,法院将择期宣判。 王暖暖表示,今天庭审过程比预想顺利,整个庭审阶段已经全部结束了,后续不会再开庭审理...
界面新闻记者 | 袁颖琪 澳洋健康(002172.SZ)正迎来关键的发展转折点。近日,这家公司71岁的创始人沈学如交棒,张家港经开区管委会成为新实控人。 根据公开的交易方案,澳洋集团计划以每股3.87元的价格,向张家港悦升科技合伙企业(下称悦升科技)转让其20%的股份,此次股权转让总价...