第22届中国计算机大会上,专家热议—— 突破大模型发展瓶颈,关键在系统创新
◎本报记者 朱 虹
“在一元二阶逻辑测试中,主流大模型得分接近0分,离通用人工智能的要求还有巨大差距。”在日前举行的第22届中国计算机大会上,华为公司战略研究院院长周红直言。
大会以“数智赋能、无限可能”为主题,集中呈现计算技术前沿成果。同时,与会专家围绕大模型、智能超算等领域的瓶颈与破局路径进行深度研讨。
当前,计算技术已进入多领域渗透、多学科融合的爆发期,正重塑生产、生活、科研范式。会上,多位专家展示了人工智能的多场景应用范例。在工业领域中,人工智能助力炼钢高炉温度精准调控,可降低千万元级成本;在医疗领域,虚拟手术模拟器可替代动物实验,优化手术方案;在科研领域,人工智能实现流体计算效率提升1000倍。
然而,快速迭代的技术背后,瓶颈问题同样突出。在周红看来,当前大模型存在三大核心挑战。一是认知偏差导致泛化能力弱,比如仅获取多面体两面信息,几乎无法预测第三面,甚至在学习加法时,未训练过的数值区间就容易出现预测失误。二是数据与能源需求极大,人类产出的高质量文本数据或将在2028年耗尽,而大模型对文本数据的需求量比人类实际产出高10万倍甚至更多,能源消耗更是远超人类大脑。三是在组合爆炸与长程推理上的能力具有明显短板,当前大模型擅长局部数据的统计与抽象,难以处理周期性以及更加复杂的规律与方法。
针对这些问题,周红提出构建世界模型的解决方案。他解释,当前深度学习依赖数据驱动形成的“经验引擎”存在明显局限,难以支撑复杂场景下的智能需求,而世界模型的核心思路是打破单一技术路径依赖,构建“经验+行动+理念”三引擎协同体系。其中,“经验引擎”延续现有优势,负责处理基于数据的统计与抽象;“行动引擎”基于目标驱动,综合规划、搜索、推理、优化、记忆等环节;“理念引擎”则是关键,它需嵌入数理化知识、知识图谱等科学认知体系,具备假设验证、抽象求解等能力,弥补经验驱动在长程推理、复杂模式分析上的短板,助力构建理解、适应与行动能力更强的模型。
在大模型发展过程中,算力问题是关键。智能超算的发展也成为大会焦点话题。“大模型性能和效果会随模型参数量、数据量和计算量的增加而扩展,大算力是大模型发展的前置条件。”中科曙光高级副总裁李斌说,据统计,全球人工智能计算机每年保持2.5倍的增速,这个速度超过摩尔定律失效前,超算发展黄金时期的最高增速。
然而,智能超算也面临日益凸显的系统层面挑战。李斌举例说,智能超算多场景适配难度大,它既要满足大模型训练的大算力需求,又要适配科学计算的全精度要求,现有系统架构难以兼顾;数据传输与计算性能失衡,体系结构复杂化导致数据传输效率落后于计算能力提升速度,现在大模型团队不得不深度参与系统工程化设计,才能保障训练效率;能耗与可靠性压力剧增,随着算力规模扩大,传统风冷已无法满足散热需求,万卡集群要实现数天无故障运行,对系统稳定性的挑战极大。
对此,李斌提出技术演进路径:推动算力系统向多元融合方向发展,通过硅光传输、高压直供、液冷等技术突破硬件瓶颈,同时强化软硬件协同与产业链协作。“未来,智能超算只有实现从‘算力堆砌’到‘系统创新’的范式转变,才能支撑更多前沿应用落地。”他说。
各省市科技厅网站
自治区政府部门网站
西藏各科研院所网站