首页

Home

首页

大数据与计算机科学学院曹永锋教授团队在人工智能领域TOP期刊上发表研究论文

科学技术处

2025-12-15

近日,我校大数据与计算机科学学院曹永锋教授团队在人工智能领域TOP期刊《Pattern Recognition》(中科院SCI一区,IF=7.6)在线发表题为“Regularized Evidential Neural Networks for Deep Active Learning”的研究论文。



深度神经网络虽然在诸多任务上表现卓越,但一个长期痛点是:模型往往对自己的预测过度自信,导致基于模型预测不确定性的决策(如样本筛选)容易被误导。模型集成、贝叶斯神经网络等不确定性量化方法虽有效,但通常伴随显著的计算开销与复杂的实现调参,影响方法的可迁移性与可复现性。相比之下,“单个确定性网络、单次前向传递即可输出不确定性”的范式更具工程吸引力,但其关键挑战正是在确定性推理框架下抑制模型固有的过度自信。在这一方向上,证据神经网络(Evidential Neural Networks, ENN)基于 Dirichlet 证据框架刻画分类不确定性:网络不再直接输出softmax概率,而是输出各类别“证据”,据此形成 Dirichlet 分布并推导不确定性度量。

论文结果表明,ENN 仍可能出现严重过度自信并伴随泛化退化,且在主动学习等低标注数据场景中尤为突出。更重要的是,本研究揭示了一个反直觉但关键的结论:在训练分类模型时,传统做法(包括ENN)往往持续“最大化对正确类别的支持”,而这种看似合理的训练逻辑,反而可能是诱发过度自信的重要根源。实验进一步验证,即便将正确类别的支持强度压到很小的水平,模型依然能够被有效训练;当把这种支持强度约束在一个适度范围内时,模型的校准性与泛化能力均可显著提升。

基于上述发现,本研究提出正则化证据神经网络(Regularized Evidential Neural Networks, RENN):以“Dirichlet–Dirichlet 的 KL 距离”替代 ENN 原有“拟合项+ 收缩项”的两阶段目标,并引入超参数显式约束正确类别证据的“适度范围”,从而将“对正确类别的适度支持”转化为可控、可调的学习约束。合成数据与真实数据的可视化结果进一步表明:相较于 ENN 中证据值易出现过大且分布混乱、不确定性质量趋于塌缩的现象,RENN 能将总体证据压缩到可控区间,使正确/错误样本的证据分布更加可分,进而形成更合理的不确定性结构;在输入空间与特征空间中,模型呈现出更平滑、更符合直觉的决策边界与低置信区域,并带来更优的校准与泛化表现。


合成 2D 螺旋数据上的证据/不确定性/决策边界对比


真实数据上的可靠性图与证据分布对比


模型泛化与校准性能随正确类别证据压缩变化的趋势


基于RENN更稳健的校准与泛化能力,该研究进一步构建了一个简单但有效的深度主动学习方法RENN4DAL:仍保持“单模型、单次前向传播”即可计算不确定性并完成选样的复杂度,论文在多种 CNN 图像任务与 Transformer 文本任务上进行了系统评估,并在与多种先进方法的对比实验中取得最佳或领先性能。

我校王鹏举博士为论文第一作者,曹永锋教授为论文通讯作者。该研究得到了贵州省科技计划项目(ZSYS[2025]011)的资助。

论文全文链接:https://doi.org/10.1016/j.patcog.2025.112836

【责任编辑】一审(校):郑兴鹏、王玥; 二审(校):张杭; 三审(校):丁龙