センサの時系列解析例題

いくつかのセンサーの出力から、状態の推定、異常検出、パターン識別をする例題を見繕ってみたメモ

たまたま見た研究会資料から
(1)多センサの多次元表現と部分空間識別器に基づく異常検知
http://jglobal.jst.go.jp/public/20090422/201102278182361273

(2)尤度ヒストグラムに基づく異常検出
http://ci.nii.ac.jp/naid/40018763233
をざっと見た

いずれも、東京農工大日立製作所の何かのシステムにつけている19個のセンサから正常稼働日と異常稼働日を識別する2クラス識別器をつくる問題。

センサの時系列データをどのように表現、特徴量にするか、したほうが識別しやすいか。

(1)多センサの多次元表現と部分空間識別器に基づく異常検知

では、出力された順にそのままデータを並べて特徴ベクトルにする。19個のセンサーなので、19次元のベクトル。ただし、データの規格化を、正常値と異常値あわてする、正常値だけでする、しない、と3パターンやってみる。

固有空間法(部分空間法)して、正常と異常の2クラスの訓練データとテストデータの距離を算出。類似度pointsを各距離から計算。

類似度pointsの合計値のとり方をいろいろかえて、precision recall, F値 で評価。

(2)尤度ヒストグラムに基づく異常検出

尤度を、各センサーの各時刻における正常日のデータから正規分布モデルに対応させた、ありえそうな感じで定義。この尤度をある時間まで積算していく。積算時間の範囲を起動前、初回起動の前後α時間、稼動中、停止作業の前後α時間、停止中、という感じでわけてつくる。特徴ベクトルは、センサー数の19次元、あるいは、連結して5×19次元、など。

3σ管理図での評価とSVMでテスト

precision recallでみると、SVMより3σのほうがよくできている。