本文對現(xiàn)有的基于經(jīng)典機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的日志異常檢測方法進(jìn)行了實證研究,并提出了一種自動化日志異常檢測評估框架LightAD。
1. 日志異常檢測介紹
日志是AIOps領(lǐng)域需要處理的常見數(shù)據(jù),是程序運(yùn)行過程中由代碼打印出的一些非結(jié)構(gòu)化的文本信息,日志通常由時間戳和文本信息組成。日志實時記錄了系統(tǒng)的運(yùn)行狀態(tài),包括正常運(yùn)行狀態(tài)和故障發(fā)生時的狀態(tài)。因此通過收集和分析日志,可以快速檢測和定位出系統(tǒng)中存在的異常。
本文研究了深度學(xué)習(xí)方法在日志異常檢測中與更簡單技術(shù)相比的優(yōu)越性,在五個公共的日志異常檢測數(shù)據(jù)集上對輕量級傳統(tǒng)機(jī)器學(xué)習(xí)方法(如KNN、SLFN)和深度學(xué)習(xí)方法(如CNN、NeuralLog)進(jìn)行了全面的評估。
本文的研究結(jié)果表明,通過合適的數(shù)據(jù)處理方式,輕量級機(jī)器學(xué)習(xí)方法能夠在時間效率和準(zhǔn)確性方面都優(yōu)于深度學(xué)習(xí)方法。為了評估深度學(xué)習(xí)方法的必要性,本文提出了一種自動化的日志異常檢測模型評估框架LightAD。LightAD是一種基于貝葉斯優(yōu)化器的優(yōu)化訓(xùn)練時間、推斷時間和性能得分的評估框架。通過自動化超參數(shù)調(diào)優(yōu),LightAD可以實現(xiàn)在日志異常檢測模型之間進(jìn)行公正的比較,使運(yùn)維工程師能夠針對不同的在線異常檢測目標(biāo)來選擇合適的異常檢測模型。
2. 對現(xiàn)有方法的全面評估
深度學(xué)習(xí)方法除了本身擁有更多的參數(shù)量外,其使用的數(shù)據(jù)處理方式通常也比較耗時。例如,CNN方法需要使用日志解析工具對日志進(jìn)行解析,NeuralLog需要用深度語言模型BERT來對日志進(jìn)行處理。本文對輕量級傳統(tǒng)機(jī)器學(xué)習(xí)方法采用了更高效的日志處理方式。
具體而言,本文在處理以日志塊來聚合的數(shù)據(jù)集(如HDFS)時,從每個文本日志消息中提取標(biāo)記,以空格分隔,并刪除包含數(shù)字的標(biāo)記。本文使用每個塊的ID將日志消息分組成日志序列,并用事件頻率對其進(jìn)行編碼。整個預(yù)處理工作流程如下圖所示。
3. 全新的日志異常檢測評估框架:LightAD
為全面綜合評估日志異常檢測算法,本文提出了基于貝葉斯優(yōu)化起的自動化算法優(yōu)化和評估框架LightAD,LightAD結(jié)構(gòu)如下圖所示。本文首先準(zhǔn)備了一組簡單的基準(zhǔn)模型及其初始的超參數(shù)空間,對于每個模型,本文會自動化的優(yōu)化模型的超參數(shù)。通過綜合考慮三個維度的模型收益打分:
(1)準(zhǔn)確性
(2)每個日志序列的訓(xùn)練時間
(3)每個日志序列的推斷時間
最終抉擇出模型收益分?jǐn)?shù)最高的異常檢測算法。
模型收益的多目標(biāo)優(yōu)化公式如下:
下圖是在去除重復(fù)數(shù)據(jù)的HDFS數(shù)據(jù)集上使用LightAD進(jìn)行異常檢測方法優(yōu)化和評估的結(jié)果,最高模型收益的分?jǐn)?shù)由黑色加粗標(biāo)識。從圖中可以看出,LightAD挑選出的模型都是輕量級的機(jī)器學(xué)習(xí)方法。
4.總結(jié)
本文來自華為云PaaS技術(shù)創(chuàng)新Lab和香港中文大學(xué)(深圳)賀品嘉助理教授團(tuán)隊合作項目成果產(chǎn)出,相關(guān)研究成果已被軟件工程領(lǐng)域頂會ICSE 2024(CCF A類)正式錄用,文章詳細(xì)內(nèi)容即將公開,敬請關(guān)注。
文章來自 PaaS技術(shù)創(chuàng)新Lab,PaaS技術(shù)創(chuàng)新Lab隸屬于華為云,致力于綜合利用軟件分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù),為軟件研發(fā)人員提供下一代智能研發(fā)工具服務(wù)的核心引擎和智慧大腦。我們將聚焦軟件工程領(lǐng)域硬核能力,不斷構(gòu)筑研發(fā)利器,持續(xù)交付高價值商業(yè)特性!加入我們,一起開創(chuàng)研發(fā)新“境界”!
詳情歡迎聯(lián)系:
mayuchi1@huawei.com;bianpan@huawei.com
原文標(biāo)題:【AIOps】一種全新的日志異常檢測評估框架:LightAD,相關(guān)成果已被軟工頂會ICSE 2024錄用
文章出處:【微信公眾號:華為DevCloud】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
華為
+關(guān)注
關(guān)注
216文章
34411瀏覽量
251496
原文標(biāo)題:【AIOps】一種全新的日志異常檢測評估框架:LightAD,相關(guān)成果已被軟工頂會ICSE 2024錄用
文章出處:【微信號:華為DevCloud,微信公眾號:華為DevCloud】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論