转载自:上海市人工智能行业协会
端云协同,简单说是让云端大模型承担复杂推理、意图理解和多步规划,端侧小模型负责实时感知、唤醒和初步处理,二者通过低延迟网络无缝配合——既保住了大模型的能力上限,又兼顾了响应速度与弱网场景下的基本可用性。
为什么是现在开始变革呢?这件事,在三年前几乎是不可能的——大模型动辄数百亿参数,手机根本装不下,即便装进去也会把电池耗尽、把芯片烫热。因为转折出现在芯片与算法的双重突破上。一方面,移动芯片中专用AI处理单元(NPU)的算力在近两年实现了数倍跃升,功耗却没有同比增长。另一方面,模型压缩技术从早期的“缩小尺寸、牺牲能力”进化到“精准剪枝、保留核心”——现在的端侧模型不是云端模型的缩水版,而是专门为移动场景设计的本地专家,在特定任务上的表现甚至超过同参数量的通用云端模型。例如:阶跃星辰在推理效率上的突破,使实时智能体在手机上具备更接近“毫秒级响应”的交互基础,让语音、触控与系统级操作真正做到随叫随到;而MiniMax在语音情绪与多模态理解上的优势,则让手机从“听懂你说什么”迈向“听懂你怎么说”,在购物、助理、陪伴等场景中提供更具温度的反馈。产品体验方面,这种情境感知的能力是AI手机区别于普通语音助手的核心所在。当你心急慌忙地说“帮我订个最早的机票”,和笃悠悠地说“帮我找个周末的好去处”,系统给出的应该是截然不同的方案——前者追求速度,后者追求体验。能读懂这种语气差异的手机,才真正算得上“懂你”。

3.12-3.14 AWE2026
东方枢纽国际商务合作区-智能终端展区
扫描二维码即可报名

欢迎转发,但请注明出处“上海经信委”
觉得不错请点赞!