1. Outlier
1.1. 정의
- 통계에서 이상치는 다른 관측치와 크게 다른 데이터 포인트 입니다. 이상값은 측정의 가변성, 새로운 데이터의 표시로 인해 발생하거나 실험 오류의 결과일 수 있습니다. 후자는 때때로 데이터 세트에서 제외됩니다. 이상값은 흥미로운 가능성을 나타내는 지표일 수도 있지만 통계 분석에서 심각한 문제를 일으킬 수도 있습니다.
2. Anomaly
2.1. 정의
- 데이터 분석 에서 이상 탐지는 일반적으로 대부분의 데이터에서 크게 벗어나고 잘 정의된 기준을 따르지 않는 희귀 항목, 이벤트 또는 관찰을 식별하는 것으로 이해됩니다. 이러한 예는 다른 메커니즘에 의해 생성되었다는 의혹을 불러일으킬 수도 있고, 해당 데이터 세트의 나머지 부분과 일치하지 않는 것처럼 보일 수도 있습니다.
즉, Outlier는 주로 통계적인 측면에서 데이터의 극단적인 값으로 간주되며 Anomaly는 예상치 못한 이벤트 또는 패턴을 나타냅니다. Anomaly는 Outlier가 될 수 있지만 항상 그렇지는 않습니다.
출처
https://en.wikipedia.org/wiki/Outlier
https://en.wikipedia.org/wiki/Anomaly_detection