摘要:通信網絡中的異常檢測為發現新的攻擊、錯誤配置和網絡故障提供了依據。 數據存儲、傳輸和處理的資源約束使得將輸入數據限制在與檢測任務高度相關的特性上,并且 (b)可以很容易地從網絡觀察中派生出來,而無需昂貴的操作。 去除強相關、冗余和不相關的特性也提高了基于學習技術的許多算法的檢測質量。 本文討論了基于網絡流量的異常檢測的特征選擇問題。 我們提出了一種采用過濾器和逐步回歸包裝器的多階段特征選擇方法。 我們的分析基于41個廣泛采用的流量特征,這些特征出現在幾個常用的流量數據集中。 結合特征選擇方法,可以將原始特征向量從41個減少到16個。