10月28日,第十九届“挑战杯”竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛(以下简称“挑战杯”擂台赛)落幕。凭借“推理大模型的训练调优与性能加速助力全栈自主AI”项目,杭州电子科技大学卓越学院计算机科学英才班2022级本科生陈龙昊获特等奖,也是该赛道最年轻的选手之一。
除了“挑战杯”特等奖,陈龙昊此前还获得中国高校机器人创意大赛全国一等奖,并成功入围国际电气电子工程师学会(IEEE)人工智能电路与系统国际会议(AICAS)大挑战,还在会上做了一个报告。
陈龙昊在IEEE人工智能电路与系统国际会议上做报告 受访者供图
“大模型推理优化与算法加速是我的兴趣所在,与其有关的学习、研究、竞赛都会让我觉得奇妙无比。”陈龙昊向《中国科学报》讲述了一个本科生跟算力较劲的故事。
触类旁通
2024年寒假,陈龙昊偶然关注到阿里天池大数据平台发布一则AICAS 2024大挑战的消息,比赛主题是“通用算力大模型推理性能软硬协同优化”,吸引他的是:入围团队可受邀参加国际会议并报销差旅。
“既是学习机会,又能开阔眼界。”陈龙昊抱着这样的初衷决定试一试。在参加比赛的过程中,他自学了大语言模型结构、推理加速原理、量化方法以及主流推理引擎架构,建立起完整的知识框架,并且结合硬件特性,提出了一种减少计算过程中指令的方法,加快了计算速度。
最终,陈龙昊所在团队从众多高校和企业队伍中脱颖而出,成功入围并获得三等奖,开启了他在大模型算力优化方向的进一步探索。
这场小试牛刀也为陈龙昊后续参加的多个关键项目打下坚实基础。在参加“挑战杯”擂台赛时,面对华为NPU(神经网络处理单元)平台这一从未接触过的硬件环境,他并未自乱阵脚,而是凭借此前对NVIDIA GPU(英伟达显卡)软硬件架构的深入理解,快速识别出不同平台之间的共性逻辑,仅用数小时便完成平台迁移与初步部署。
“很多技术本质相通,关键是能不能打通底层思维。”陈龙昊道出了成功的秘诀。
在“挑战杯”擂台赛中,真正的挑战是,如何在有限资源下,训练出一个参数量小但精度高的模型。性能排名靠前的队伍往往依赖庞大算力堆叠,而陈龙昊选择走另一条路——从数据源头入手。
他设计了一套基于AI Agent(人工智能智能体)的数据集生成与筛选系统,耗时近一个月,最终构建出高质量、高覆盖率的训练数据集。这套系统不仅能自动评估样本有效性,还能根据反馈动态调整生成策略,提升了模型泛化能力。
此外,陈龙昊还针对性改进训练算法。在复赛阶段虽性能略逊于部分对手,但其模型精度显著领先,最终凭借综合优势获特等奖。
用户只需说出“水温有点高”或“喂食时间到了”,系统即可自主响应并执行操作。这是在中国高校机器人创意大赛中,陈龙昊与团队队员合作提出将大语言模型融入智能鱼缸系统的创新构想。
参加中国高校机器人创意大赛对陈龙昊来说是“临危受命”,因为有队员临时退出,他迅速与另外两名队员合作补全视觉识别模块,凭借融合自然语言交互的智能生态设计最终获赛事一等奖。
知行合一
作为一名本科生,陈龙昊以第一作者身份或参与发表了4篇论文,内容涵盖大模型压缩、推理加速架构设计及低资源微调技术、数值模拟等研究领域。
在为一个教育类大模型做总体算法架构时,陈龙昊提出了一整套从数据生成、监督微调到强化学习的完整训练流程。面对缺乏大规模标注数据的困境,他启用AI Agent技术,让智能体先“理解”内容输出,再据此生成符合教育传播规律的文本数据。
“我们要让机器学会‘讲故事’。”陈龙昊说。他通过构建知识图谱指导数据生成,并引入模型自判机制过滤低质输出,最终训练出的语言模型逻辑清晰,已在教学辅助、思政宣传等多个场景试点应用,获得良好反馈。
“资源永远有限,但创造力可以无限。”陈龙昊认为,“理论和实践,就像人的两条腿,缺一不可。”
陈龙昊不主张死记硬背公式,而是习惯“代入式思考”,把自己放在技术提出者的角色中,追问“当时遇到了什么问题?为何要这样解决?他说:“这种思维方式能穿透表象,抓住本质,实现真正的融会贯通。”
“我不玩游戏,也不刷短视频,省下来的时间都用来思考和做项目。”陈龙昊在实践中也意识到,“不要在极度疲劳状态下硬撑。”他自己曾因连续熬夜调试模型导致判断失误,后来学会在露营、旅行等放松状态下留白思考。
“最好的灵感,往往出现在放下压力的那一刻。”一次野外露营中,陈龙昊突然想到解决模型精度下降的新方案,当即打开笔记本远程调试,次日结果验证成功。
面对失败,陈龙昊有自己的对策:“十个方案九个不行,很正常。关键是不停尝试。”在他看来,竞赛的意义不只是拿奖,而是一个不断试错、迭代认知的过程。“每一次挫折都在加固技术底盘,为攻克下一个难题积蓄力量。”
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。