近日,人工智能与模式识别领域的顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(TPAMI)接收了beat365正版唯一官方网站李新德教授团队的最新研究成果。该研究创造性地将经典控制理论与前沿元学习相结合,提出了一种名为“层自适应PID优化器(LA-PID)”的新算法,为突破少样本学习中的数据稀缺瓶颈提供了高效稳定的新方案。该工作的前期版本曾于2024年在国际机器学习顶级会议(ICML)上发表,本次在TPAMI上刊发的期刊版本进行了全面的理论深化与实验拓展。本研究由beat365正版唯一官方网站博士生张鹏飞、余乐等主导完成,研究工作获得了国家自然科学基金等项目的支持。

图1 方法启发框架:PID控制环路+元学习
在医疗诊断、无人系统适应等现实场景中,获取大量标注数据往往成本高昂或极为困难。少样本学习技术旨在让模型仅通过极少数示例就能掌握新任务,但其训练过程常因数据不足而面临不稳定、收敛慢的挑战。现有方法大多依赖于固定的梯度更新规则,难以根据任务差异和网络不同层次的特点进行精细、自适应的调整。针对这一难题,李新德教授团队从控制工程的基础理论中获得了关键灵感。研究人员将神经网络的训练过程类比为一个动态系统的调控问题,首次将广泛应用于工业控制的PID(比例-积分-微分)控制器原理深度融入模型优化框架。这一创新的LA-PID优化器,能够智能地协调当前梯度、历史梯度累积和梯度变化趋势三方面信息,如同一个“智能调节器”,在加速训练收敛的同时,有效抑制波动,提升学习稳定性。这项工作的突出贡献在于实现了“一层一策”的动态精细化优化。不同于传统方法对全网采用统一规则,LA-PID通过一个轻量的辅助网络,实时分析每一层网络参数的统计特征,并为每一层独立生成最合适的PID控制增益。这使得负责提取边缘纹理的浅层和负责理解语义概念的深层,都能以最适合自身特性的方式被优化,极大增强了模型的适应能力和表达效率。
实验结果表明,该算法在多个国际公认的少样本学习基准测试中均取得领先性能。无论是在mini-ImageNet、CIFAR-FS等通用数据集上的分类任务,还是在从自然图像到鸟类细分类图像的严峻跨域测试中,LA-PID都显著超越了以往的主流方法。可视化分析进一步证实,经其训练的网络能够关注到图像中更关键、更具判别性的区域。这项研究是控制科学与人工智能交叉融合的一次成功实践,它不仅为少样本学习提供了强大的新工具,更重要的是为整个深度学习模型的训练过程优化开辟了新路径。这种全新的研究范式,将智能系统的学习过程转化为一个可观测、可调控的动态系统,为未来构建具有更高稳定性、效率与可控性的学习系统提供了关键思路。

图2 关键网络层的CAM热力图可视化对比

图3 不同数据集下的动态PID参数引导下的模型损失可视化效果图



