# Anomaly Detection

38개의 포스트
post-thumbnail

[Anomaly Detection] Local Outlier Factor (LOF)

> 출처: DSBA 연구실 유튜브 와 DSBA 연구실 강의자료 를 참고하면서 스터디를 진행하였습니다. 주제: Anomaly Detection: Local Outlier Factor (LOF) 1. Local Outlier Factors (LOF) 밀도 기반 이상치 탐지의 연장선에 있음. 어떤 객체가 주어졌을 때, local density를 고려해서 정의를 하자! 데이터 포인트의 지역적 밀도와 그 주벼 데이터 포인트의 밀도를 비교함으로써 이상치를 탐

2023년 9월 13일
·
0개의 댓글
·
post-thumbnail

[Anomaly Detection] Parzen Window Density Estimation

> 출처: DSBA 연구실 유튜브 와 DSBA 연구실 강의자료 를 참고하면서 스터디를 진행하였습니다. 주제: Anomaly Detection: Parzen Window Density Estimation 1. Kernel-density Estimation 기존에는 특정한 파라미터와

2023년 9월 13일
·
0개의 댓글
·
post-thumbnail

[Review and Implementation]LSTM-based Encoder-Decoder for Multi-sensor Anomaly Detection

들어가기 전 최근 회사에서 multi sensor를 활용한 이상치 탐지를 해야하는 업무가 있었다. 기존의 있던 rule base의 알고리즘이 사용자가 많아지면서 그 한계를 보인것 같다. 급한데로 rule base의 알고리즘을 조금 수정해서 문제를 어느정도 해결할 수 있을 것으로 보이지만 근본적으로 완벽한 해결책은 아니었다. 때문에 장기적인 관점에서 딥러닝을 활용해서 문제를 해결할 수 있지 않을까하는 생각에 여러 모델을 실험하고 있다. 이번에 만들어본 LSTM 기반 Auto Encoder 모델은 이 task에 처음 시도해본 모델이다. 결론부터 말하자면 우리 task에는 기대만큼 성능이 좋지 못했다. 그 이유가 parameter 문제인지 아니면 preprocessing의 문제인지는 좀 더 조사해봐야 알 수 있겠다. Paper Review paper link : [LSTM-based Encoder-Decoder for Multi-sensor Anomaly

2023년 9월 12일
·
0개의 댓글
·
post-thumbnail

[Anomaly Detection] Gaussian Density Edstimation

> 출처: DSBA 연구실 유튜브 와 DSBA 연구실 강의자료 를 참고하면서 스터디를 진행하였습니다. 주제: Anomaly Detection: (Mixture of) Gaussian Density Edstimation 1. Density-based Novelty Detection 주어진 데이터를 활용해서 정상적인 normal 분포를 추정한 다음에 추정된 분포를

2023년 9월 6일
·
0개의 댓글
·
post-thumbnail

[Anomaly Detection] Overview

> 출처: DSBA 연구실 유튜브 와 DSBA 연구실 강의자료 를 참고하면서 스터디를 진행하였습니다. 주제: Anomaly Detection: Overview 1. Machine Learning 명확한 Task 와 그 Task에 대해서 측정할 수 있는 가 있을 때, 충분한 데이터 를 제공해주면 특정 Task에 대해서 성능이 점점 향상되는 프로그램을 의미함. (Mitchell, 1997) 지도학습과 비지도학습으로 나누어지고, 종속변수의 유무에 따라 나뉨. 1.1. Unsupervised Learning

2023년 9월 6일
·
0개의 댓글
·

[논문 리뷰] Outlier Impact Characterization for Time Series Data (AAAI,2021)

📌 본 내용은 논문 입문자가 개인적으로 필기한 내용입니다. 내용에 오류나 피드백이 있으면 말씀해주시면 감사히 반영하겠습니다.📌 😅 이번 리뷰는 손필기로 대체합니다 😊 개인 기록용 포스트입니다 ![](https://velog.velcdn.com/images/ha_yoonji99/post/79785002-0fb5-4f56-8d9b-0

2023년 8월 12일
·
0개의 댓글
·
post-thumbnail

Deep Learning for Anomaly Detection: A Survey

본 포스팅은 제가 읽었던 논문을 간단하게 정리하는 글입니다. 논문의 모든 내용을 작성하는 것이 아닌, 일부분만 담겨 있으므로 자세한 내용은 원본 논문을 확인해 주시기를 바랍니다. 또한, 논문을 잘못 이해한 부분이 있을 수 있으므로, 양해 바랍니다. Abstract 본 논문의 목적은 두 가지로, 딥러닝 기반 이상 탐지 연구 방법의 포괄적인 개요를 제시하며, 다양한 도메인에서 이상 징후에 대한 이러한 연구 방법의 도입을 검토하고 그 효과를 평가하고자 함. 기본 가정과 접근 방식에 따라 이상 탐지 방법을 여러 카테고리로 분류함. 각 카테고리에는 기본적인 이

2023년 7월 24일
·
0개의 댓글
·
post-thumbnail

LSTM 오토인코더를 이용한 이상 탐지의 임계치 결정 방법

본 포스팅은 제가 읽었던 논문을 간단하게 정리하는 글입니다. 논문의 모든 내용을 작성하는 것이 아닌, 일부분만 담겨 있으므로 자세한 내용은 원본 논문을 확인해 주시기를 바랍니다. 또한, 논문을 잘못 이해한 부분이 있을 수 있으므로, 양해 바랍니다. 요약 이상 탐지에서 임계치(임계값)는 이상 탐지 성능에 직접적인 영향을 주는 중요한 요소임. 본 논문에서는 정상 데이터의 복원 오차 최댓값과 이상 데이터의 복원 오차 최솟값 사이의 비율을 사용하여 임계치를 결정하는 방법을 제안함. 캐글의 펌프 데이터를 대상으로, LSTM 오토인코더 모델을 구현한 후 실험한 결과 기존 정밀도-재현율 그래프 방법보다 정확도와 재현율이 향상되었음.

2023년 7월 19일
·
2개의 댓글
·
post-thumbnail

머신러닝 기반 사용후핵연료 안전정보 이상치 탐지 : XGBoost와 OCSVM을 이용한 성능 비교

본 포스팅은 제가 읽었던 논문을 간단하게 정리하는 글입니다. 논문의 모든 내용을 작성하는 것이 아닌, 일부분만 담겨 있으므로 자세한 내용은 원본 논문을 확인해 주시기를 바랍니다. 또한, 논문을 잘못 이해한 부분이 있을 수 있으므로, 양해 바랍니다. 요약 본 논문는 XGBoost 기반의 이상치 탐지를 소개함. 기존에 사용되어 온 OCSVM과의 비교를 통해 XGBoost의 성능을 비교 분석함. 서론 일반적인 산업 현장에서는 비정상 데이터보다 정상 데이터의 수가 훨씬 많음. 비정상 데이터 없이, 정상 데이터만으로 모델을 학습하여 이상 탐지를 수행하는 여러 방법이 존재함. 본

2023년 7월 19일
·
2개의 댓글
·

[Paper Review] Anomaly Detection for IoT Time-Series Data: A Survey

Anomaly Detection for IOT Time-Series Data: A Survey 위 링크를 클릭하시면 논문원본을 보실 수 있습니다. -Introduction Anomaly Detection은 데이터 내의 예기치 않은 관측치 또는 시퀀스의 식별을 포함하며 현재 사용되는 기법들은 대부분 개별 도메인 지식에 지배적이라고 할 수밖에 없다. 이에 Internet of Things(이하 IOT라 지칭)는 sensor, actuator, computer 등을 통해 관측하며 관리자로 하여금 이상치 또는 정상치 해석을 유도하며 도메인 지식과의 상호작용을 도와주는 이점을 갖고 있어 활발한 개발이 이루어지고 있다. -Methods for defining anomaly Hawkins “어떤 메커니즘에 의해 생성된 것으로 의심될 정도로 다른 관측치와 크게 다른 관측치” Barne

2023년 5월 26일
·
0개의 댓글
·
post-thumbnail

[시계열] Time-Series Anomaly Detection Service at Microsoft (SRCNN)

모든 Paper review는 제가 공부하고 남기는 기록입니다. 잘못된 내용이나 추가 의견이 있으시면 언제든 자유롭게 댓글 남겨주세요. > **Published: KDD, 2019 Paper: https://arxiv.org/abs/1906.03821** [요약] Vision 분야에서 사용하는 Spectral Residual 방법론을 도입하여 이상치와 정상 데이터를 구분하고, 이를 CNN 기반 모델로 탐지하는 SRCNN 방법론을 제안했습니다. 이는 기존 대비 20% 이상의 매우 큰 성능 향상을 보였습니다. SRCNN은 다양한 형태의 시계열 데이터에 쉽게 적용할 수 있습니다. 또한 연산 속도가 빠르고 가벼워서 온라인 서비스에 쉽게 적용할 수 있습니다. [서론] Abstract 어느 정도 규모가 있는 기업들은 제공하는 서비스/제품에 대해 다양한 모니터링이 필요합니다. MS의 경우 시계열 기반 이상탐지 모델을 사용합니다. 논문에서 설명하는 파이프라인

2023년 5월 24일
·
0개의 댓글
·

Multivariate Time-series Anomaly Detection via Graph Attention Network (a.k.a MTAD-GAT)

Multivariate Time-series Anomaly Detection via Graph Attention Network 2020 IEEE International Conference on Data Mining (ICDM) Introduction 이전의 방법들의 한계점 : 시계열 간의 상관관계를 고려하지 않아 False Positive가 탐지 됨 실제 데이터 수집 상황은 multivariate 때문에 univariate time sereis의 이상읕 탐지 하는 것은 해당 시스템의 정상 작동 여부를 판단하기에 어려움이 있음 한 시계열이 변화가 바로 시스템 오류를 의미하지 않을 수 있음 ➞ 시스템을 구성하고 있는 각 시계열 간의 상관관계를 확인하는 것이 필요함 gr

2023년 5월 8일
·
0개의 댓글
·
post-thumbnail

시계열 이상치 탐지(Anomaly Detectionwith time series)

오늘은 시계열데이터, 좀 더 정확하게 말하자면 생체 신호 데이터에서 이상치 탐치하는 법에 대해서 공부를 해보았다. > 이 글은 개인적인 기록이자 내가 공부한 것에대한 정리용도임을 먼저 밝힌다. 때문에 정확하지 않은 지식이 마구 섞여있을 것이다. 최대한 조심하고 있지만 잘 모르는 입문자 압장에서 너무 많은 고민을 하다가는 한 줄도 정리하지 못 할것 같아 그냥 적기로 했다. 앞으로도 생각나는데로 작성할 생각이라 점차 지식이 쌓여가면 좀 더 정확해 지지 않을까 생각한다. 그러므로 혹시라도 이 글을 읽게 되시는 분들은 그냥 '이런게 있구나' 정도의 참고만 해주면 좋을 것 같다. anomaly detection STL Decomposition 시계열 이상치 탐색에서 가장 먼저 볼 수 있는 것은 STL decomposition이다. Seasonal, Trend, Loss 좀 더 정확히 말하자면 >"Seasonal and Trend decomposition usin

2023년 4월 11일
·
0개의 댓글
·

PaDiM : a Patch Distribution Modeling Framework for Anomaly Detection and Localization

PaDiM : a Patch Distrivution Modeling Framework for Anomaly Detection and Localization International Conference on Pattern Recognition, International Workshops and Challenges 2021 (ICPR 2021) Abstract pre-trained CNN based model 이상 부분이 존재하는 구역을 탐지 Multivariate Gaussian distribution : normal class의 probabilistic representation을 얻기 위한 목적 Introduction 이미

2023년 3월 16일
·
0개의 댓글
·

Sub-Image Anomaly Detection with Deep Pyramid Correspondences

Sub-Image Anomaly Detection with Deep Pyramid Correspondences arXiv 2020 출처 : paperswithcode MVTec dataset을 사용한 anomaly detection task에서의 rank Introduction 대부분의 제품은 정상으로 존재하지만, 일부 제품에 결함이 존재할 수 있음 이 때, 이러한 결함이 존재하는 제품을 빨리 감지하는 것이 중요 각 제품의 결함을 탐지하기 위해서는 computer vision solution이 필요 본 논문에서는 이미지에 존재하는 이상 부분을 탐지하기 위한 방법을 제시 제안하는 방법은 Semantic Pyramid Anomaly Detetion(SPADE)라고 칭함 기존

2023년 3월 9일
·
0개의 댓글
·

Time Series Anomaly Detection with Multiresolution Ensemble Decoding

Time Series Anomaly Detection with Multiresolution Ensemble Decoding 2021 AAAI Conference on Artificial Intelligence (AAAI-21) RNN based autoencoder with decoder ensembles 기존 RNN을 사용한 autoencoder는 sequential decoding으로 인해 overfitting 및 error accumulation이 발생하기 쉬움 ➜ decoding length가 다른 여러 개의 decoder를 사용하는 방법을 적용 Introduction previous recurrent auto-encoder based anomaly detection methods ➜ privious time steps로 인한 error accumulation 때문에 long time series를 reconstructio

2023년 1월 31일
·
0개의 댓글
·

Outlier Detection for Time Series with Recurrent Autoencoder Ensembles

Outlier Detection for Time Series with Recurrent Autoencoder ensembles 2019 International Joint Conference on Artificial Intelligence (IJCAI-19) Autoencoder ensemble based Time series anomaly detection method ensemble ➜ overfitting된 일부 autoencoder의 영향을 줄이면서 model의 전반적인 성능을 향상시키는 것이 목표 Introduction previous autoencoder ensemble methods ➜ time series보다 non-sequential data에 적합했음 time series에 적합한 autoencoder ensemble을 구축하기 위하여, Recurrent Neural Network(RNN)을 사용 ➜ sp

2023년 1월 28일
·
0개의 댓글
·

Outlier Detection with Autoencoder Ensembles

Outlier Detection with Autoencoder Ensembles 2017 SIAM International Conference on Data Mining (SDM) Introduction In this paper, authors proposed autoencoder ensemble method : Randomized Neural Network for Outlier Detection(RandNet) fully connected autoencoder 대신 randomly connected autoencoder를 사용 각 autoencoder는 structures와 connection densities가 서로 다름 ➜ computational complexity ↓ Deep Neural Network의 overfitting 위험성이 존재하며 종종 local optima로 수렴 ➜ 일부 structure가 o

2023년 1월 26일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] Timeseries Anomaly Detection using Temporal Hierarchical One-Class Network

1 Abstract Real-world에서 시계열은 복잡한 Temporal-dynamics를 가지며, 이로 인해 이상 탐지에 어려움이 발생함에 따라 Temporal Hierarchical One-class network를 제안한다. 제안 모델은 Skip-connection을 도입한 Dilated RNN을 사용하여 다양한 scale에서 Temporal-dynamics을 포착한다. Hierachical clustering process로 얻은 여러 Clustering boundary을 사용하여 Multiscale Vector Data Description을 정의하고, 이를 통해 Temporal dynamics을 잘 포착하도록 한다. Introduction 실제 Time-series는 Nonlinear

2023년 1월 25일
·
0개의 댓글
·

A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data

A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data 2019 AAAI Conference on Artificial Intelligence mutlivariate time series anomaly detection method signature matrix multivariate time series의 각 time series 사이의 inter-correlation을 사용한 signature matrix를 input으로 사용 Introduction multivariate time series anomaly detection previous anomaly detection methods ex) distance/clustering method(kNN), classification methods

2023년 1월 24일
·
0개의 댓글
·