我院科研团队与本科校友在CVPR2025上合作发表工业异常检测最新成果

作者:王英杰编辑:吴仰天发布:2025-04-03点击量:

3月,我院科研团队与本科校友的合作论文《Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection(从单张图像中提取正常模式)》被计算机视觉与模式识别领域国际顶级学术会议CVPR 2025(IEEE/CVF Conference on Computer Vision and Pattern Recognition)主会接收,当年录用率为22.1%。论文作者包括清华大学精密仪器系的博士生、我院2023届本科测控技术与仪器专业校友罗威、2022届本科测控技术与仪器专业校友姚海明,我院2020级博士生曹云康、2023级博士生程育奇及导师沈卫明院士。余文勇副教授为论文通讯作者,曾担任罗威、姚海明本科毕业论文指导教师。

工业异常检测的常规方法是将测试图像与训练集里学习到的正常模式进行比较,但面对外观和位置变化时容易产生对不齐问题,从而导致误检或漏检。注意到在异常样本中,有价值的正常信息仍然存在,并且与异常更融合。受此启发,论文提出了一种全新的方法INP-Former。

该方法不依赖于训练集的正态性,而是直接根据一张测试图像就能提取内在正态原型(INP),并利用这些 INPs 指导图像重建,通过重建误差实现异常检测。为此,论文设计了INP提取器,提出了INP相干损失,以确保INP能够忠实地表示测试图像的正态性,并设计软挖掘损失来处理训练过程中难以优化的样本。该方法在异常检测国际权威数据集MVTec-AD、VisA和Real-IAD的单类、多类和小样本异常检测任务,以及零样本任务中实现了较先进的性能,有望成为一种通用的异常解决方案。

算法模型

(a)模型由预训练编码器、INP提取器和INP引导解码器组成。INP提取器动态地从单个图像中提取固有的正常原型,INP引导解码器利用这些原型抑制异常特征。(b) INP提取器结构。(c) INP引导解码器的结构。(d) INP引导注意与自我注意的计算复杂度比较。

多类产品检测模型在三个权威数据集上取得了SOTA结果

异常检测排行榜全球排名第二

MVTec-AD、VisA和Real-IAD三类权威数据集上的检测效果

零样本检测能力(在VisA上训练,在MVTec-AD上检测)

该方法主要优势如下:

1、解决通用工业异常检测难题:

(1)通过某个产品的少量样本,训练一个检测模型:适用于试生产时期;

(2)通过某个产品的大量样本,训练一个检测模型:适用于正式生产时期;

(3)多个产品仅训练一个检测模型:适用于扩大再生产时期;

2、计算效率高:训练时间为1个半小时(GPU4090),推理时间40ms(未优化前),有较大的工业应用价值。

相关代码已开源,可供研究者进一步探索和应用。


论文链接:https://arxiv.org/pdf/2503.02424

代码地址:https://github.com/luow23/INP-Former

全球排名:https://paperswithcode.com/paper/exploring-intrinsic-normal-prototypes-within#code

Copyright © 华中科技大学机械科学与工程学院 版权所有本网站所使用的方正字体由方正电子免费公益授权