XAI 방법들을 어떻게 비교, 평가하는지 (어떤 설명 방법이 좋은 설명 방법인지)
고안된 방법의 문제점은 없는지
사람들의 투표를 통해 평가
2) 어떤 설명이 더 잘 되어있는지 사람들이 평가
=> 돈, 비용이 많이 든다
mean IoU를 활용: 정답 map과 예측 map이 얼마나 겹치는지를 나타내는 지표
단점: annotation dataset을 얻기 쉽지 않고, 비용이 든다. bounding box와 segmentation 데이터의 정확도도 신뢰하기 어려움
Pixel perturbation
1) AOPC (Area Over the MoRF Perturbation Curve)
LRP 기반 방법이 가장 높은 AOPC 값을 가짐 => 주요 픽셀을 잘 구분해냄
2) Insertion and Deletion
: 픽셀을 하나씩 지워가면서 주요 픽셀을 구함
이를 보완한 기법
ROAR
Sanity checks
1) Model randomization test
2) Adversarial attack
딥러닝 모델의 취약점: 적대적 공격 (입력 이미지에 약간의 변경을 가하게 되면 분류기의 예측 결과를 완전히 만들 수 있음)
=> XAI에서는 완전 다른 설명을 출력할 수 있다는 문제점
3) Adversarial model manipulation
=> 모델 계수들을 조금씩 조작하여 설명이 공정하게 나타나는 것처럼 보이게 출력하기