近日,中国科学院合肥物质院安光所桂华侨团队联合安徽医科大学第一附属医院、合肥市第一人民医院等单位,开发出一款通用半监督AI学习框架。该框架支持半监督学习(SSL)、无监督域自适应(UDA)和半监督域泛化(Semi-DG)三项任务,能够显著减轻3D医学图像分割场景下的标注负担,同时提升模型多中心泛化性能。相关成果以《基于频率捷径视角的通用半监督3D医学图像分割研究》为题,发表在Pattern Recognition上。
在3D医学图像分割工作中,人工标注工作量大、流程繁琐,且依赖专业人员操作。半监督学习可充分利用已标注精准数据,同时借助大量低成本未标注图像。主流半监督学习方法,默认标注数据与未标注数据来源一致、特征相近。但真实医疗场景以多中心协作模式为主,影像数据采集设备、参数各不相同,易造成数据差异偏移问题,引发无监督域自适应、半监督域泛化等难题。搭建适配多种任务的通用算法框架,是破解医学影像标注短缺、数据域偏移两大难题的关键。此外,现有研究表明,人工智能神经网络往往会优先学习简单的频率特征来完成识别判断,这一现象被称作频率捷径。虽然能简化模型训练,却会大幅降低模型的通用适配能力。而半监督学习常用的虚拟标注结果本身存在偏差,会进一步加剧频率捷径带来的负面影响。
针对以上痛点,研究团队创新提出抑制频率捷径的新思路,依托对抗训练架构,设计两种全新的数据增强模块,从数据层面限制模型的有偏见学习问题,全面提升模型的泛化与适配能力。一是低频对抗自适应增强模块(L-AAE),避免模型过度依赖单一主流频率特征,同时通过双向对抗调整与风格优化,缩小不同来源医学影像的数据差异。二是进一步提出了频率自适应抑制增强模块(F-ASE),动态调节图像不同频率的特征权重,引导模型全面学习各类频率信息,减少对特定特征的过度依赖。最后,将原始影像与优化后的对抗样本结合,融入半监督学习体系开展训练。团队在相关 SSL、UDA 和 Semi-DG 等多项公开标准数据集上完成大量对比实验,充分验证了该方法的先进性与实用性。
该研究为半监督模式下的医学图像分割,提供了新的选择。通过克制频率捷径问题,训练出稳定性更强、分割精度更高的 AI 模型。研究仅采用基础通用网络V-Net作为对照,仍实现了优异效果;且所提出的L-AAE 和F-ASE两大模块的功能独立于模型架构,不局限于特定网络结构,兼容性强、适用范围广,可快速迁移应用到各类主流算法模型中。除此之外,这套削弱频率捷径的优化思路,同样适用于弱监督、数据差异明显等复杂场景,能够普遍提升 AI 模型的稳定性,后续还有望推广应用到医学图像分割以外的更多研究领域。
博士生黄义庚为论文第一作者,王焕钦研究员为通讯作者。本研究得到了国家重点研发计划、安徽省转化医学研究项目的支持。

通用半监督学习框架示意图
