我的位置: 上观号 > 上海科协 > 文章详情

破界而来!上海创智学院首发八大AI成果

转自:上海科协 2025-07-26 17:25:51

2025年7月24日,上海创智学院举行成果发布会,首发8项前沿创新成果,涵盖认知智能、情境智能、具身智能、科学智能、基础设施等多个人工智能核心领域。

三大智能核心突破,让“不可能”变成“可能”

当机器学会思考、理解环境和作用于物理世界,认知智能、情境智能与具身智能正书写新标准,推动AI成为改变世界的真实力量。上海创智学院重磅发布“Q计划-深度认知引擎”“面向情境智能的拟人化语音交互模型”及“数字基因”,彰显其在三大智能领域的引领性突破。

认知智能:跨越边界的思维革命

认知能力的跃升将突破AI的工具属性边界,使其思考时间从秒级延展至小时、月甚至年级,重构人工智能的极限。刘鹏飞团队为此贡献三大核心成果:发布全球首部《认知工程》白皮书奠定理论基石;创新提出Mid-training认知训练范式,并开源史上最大科学推理数据集MegaScience(基于超万本高质量教科书)及700亿认知语料;打造全球首个认知积累AI平台——Deep Cognition。这标志着AI从“对话交互”迈向“认知协作”的革命性转变。

情境智能:拟人交互的终极想象

实现基于情境的自然交互是智能体的关键目标。邱锡鹏团队联合复旦、模思智能OpenMOSS团队,发布“面向情境智能的拟人化语音交互模型”MOSS-Audio。该模型突破行业“恐怖谷效应”与多角色对话生硬瓶颈,通过深度理解完整对话情境,实现超高拟人度、自然流畅的多角色语音合成,精准复现音色、语气与韵律变化,性能业界领先,已应用于AI播客制作。MOSS-Audio融合大模型推理与深度语境感知,为“情境智能”奠定基石。

具身智能:万物操作的通用“说明书”

理解并操作万物需克服数字孪生难以规模化的瓶颈。受生物基因启发,卢策吾团队全球首创“数字基因”,构建可解析的通用具身操作世界观,堪称“真实世界的Alphafold”。它替代传统数字孪生,解析海量物体操作规则,首次攻克“感知-程序”大模型难题,解决机器人操作不可泛化与规模化困境。开源1亿带操作的高质量数据资产(目标10亿),旨在打造具身智能产业的“北斗”级基础设施,赋能机器人未来如人般操作与链接万物。

三大技术基座创新,从创造可能到实现价值

基础设施是驱动智能时代进化的引擎,为产业应用提供稳定、可扩展的底层支撑。

终端突破:破解“不可能三角”

终端面临“能效-空间-智能”的固有难题。戴国浩团队发布终端本征大模型“Megrez 2.0 Preview版”。它以仅3B的实际计算量,实现媲美21B模型的智能水平,内存需求却低至7B规模的INT4量化(<4G),广泛适配各类终端。实测性能显著领先:比同内存模型快50%,比同尺寸稠密模型精度高20%,比同精度模型省内存60%。其创新设计利用设备“休眠时段”持续创造价值,赋予终端更强能动性。

开源基石:释放AI潜能

为打破闭源垄断,上海创智学院打造创智自主智算系统,发布面向下一代推理的强化学习开源框架siiRL,建设最适合未来模型的AI基础设施,成为“开源infra”。siiRL具备完全分布式设计(可扩展至千卡/万卡)、模块化架构(支持多智能体协同),并兼容多款国产芯片。性能上,siiRL全场景领先主流框架,尤其在多模态和长下文场景效率快2-7倍。该框架已100%开源,目标实现“大模型跑在中国芯,AGI基石全球共享”。

教育基建:赋能教育系统变革

如今,AI 使得人才的培养与选拔都可能发生根本性的变革,教育大模型相关技术长期被国际巨头垄断。周爱民团队推出的 “启创•InnoSpark 1.0” 力图改善这一现象,打造有中国特色的教育基座大模型。该模型基于国产千问基座自研,深度聚焦教育场景,解答教育问题,赋能学科教研,助力实现教学育人一体化。相比通用大模型,“启创•InnoSpark”在塑造正确价值观、培养创新思维、实现因材施教方面优势显著,预计今年9月正式公开对外提供服务。

辐射多个领域,探索科技普惠之路

朱通团队发布“面向能源化工的原子级基座模型”,破解煤炭高效精准转化难题。该模型深入理解化学反应规律,实现反应路径秒级预测及谱学信号与机理双向对齐,已与国能集团合作取得应用进展。

上海创智学院2024级博士生赵欣彦代表团队发布“万物有灵”具身智能项目,提出打造“硬件中的大模型”核心理念。通过可重构模块单元(独立功能,协同组合),构建适应复杂任务的新形态机器人。已探索“宏原子”模块化、验证“管水母”自主变形能力,类人伙伴“创智龙”将于9月发布。项目由创智学院多学科团队推动。

来源:上海创智学院