工作动态

我中心在IT运维系统的多指标时间序列异常检测研究工作中取得进展

2023-09-18 10:47 | 放大 缩小 |

对于互联网服务提供者来说,根据服务系统中部署的多维观察指标快速准确地发现系统中出现的异常能够大大降低损失,确保服务质量。然而,多维指标之间时序特征可能不尽相同,在异常检测任务中这些特征的不一致性会降低异常检测效果,导致误判、漏判异常。我中心科技云部针对该问题提出了一种基于无监督学习的多指标实时异常检测模型CAD。该方法利用卷积网络捕捉时序指标特征,通过独立特征选择方法、双门控机制和下游任务隔离结构有效解决了特征不一致导致的学习目标冲突问题。实验表明该方法在多个数据集上均达到最优检测效果。该检测方法作为科技云智能运维系统的重要一环,可以根据科技云运行系统的关键性能指标监控系统运行状态,在发生异常和故障时及时告警,提高系统运行稳定性。 

图1 针对学习目标冲突问题的多维时序异常检测模型框架  
该研究成果已经被软件工程领域的国际会议ESEC/FSE’23 Industry Track (ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering,CCF A类) 接收。论文的第一作者为科技云发展部博士研究生司昊田,导师为黎建辉研究员,通信作者为科技云发展部副研究员裴昶华。  
该成果得到国家重点研发计划项目、国家自然科学基金项目和中国科学院网信专项项目等项目支持。  
相关成果:  Haotian Si, Changhua Pei, Zhihan Li, Yadong Zhao, Jingjing Li, Haiming Zhang, Zulong Diao, Jianhui Li, Gaogang Xie, Dan Pei. Beyond Sharing: Conflict-Aware Multivariate Time Series Anomaly Detection. The 31st ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering. (ESEC/FSE 2023 Industry Track)


附件下载