감정 인식을 위한 신뢰할 수 있는 뇌파 표현을 학습하기 위한 새로운 반지도형 아키텍처인 PARSE를 제안한다.
1) 대량의 레이블이 지정되지 않은 데이터와 제한된 수의 레이블이 지정된 데이터 사이의 잠재적인 분포 불일치를 줄이기 위해 PARSE는 쌍별 표현 정렬을 사용한다.
2) 모델을 엄격하게 테스트하기 위해 PARSE를 여러 최신 반지도 접근 방식과 비교하고, 이를 EEG 학습에 맞게 구현 및 조정한다.
3) 클래스당 하나의 샘플만 레이블이 지정된 경우, 레이블이 지정되지 않은 데이터와 레이블이 지정된 데이터 간의 분포 정렬을 수행함으로써 쌍별 표현 정렬이 성능을 크게 향상시키는 것을 알 수 있다.
→ label이 있는 데이터와 label이 없는 데이터를 한 쌍으로 MixUp한다.
→ Label이 지정되지 않은 데이터와 label이 지정된 데이터 사이의 불일치를 줄이기 위해 Pairwise representation alignment를 적용한다.
→ GRL과 Domain Discriminator을 사용한 적대적 학습을 통한 분류 성능 향상한다.
[ PARSE의 방식 ]
→ 레이블이 지정되지 않은 대량의 데이터와 제한된 수의 레이블이 지정된 데이터 간의 잠재적인 분포 불일치를 줄이는 것
[ 데이터 셋 별 분석 결과 ]
→ 사용된 모델: Π-model, Temporal Ensembling, Mean Teacher, Pseudo-Labeling, Convolutional autoencoder, MixMatch, FixMatch, AdaMatch
SEED: 15명의 참가자가 수행한 실험에서 세 가지 감정을 자극으로 사용한 15개의 필름 클립으로 구성된 데이터 셋 → EEG 신호는 1초 세그먼트로 분리
다양한 양의 제한된 라벨 표본을 사용하여 전반적으로 최상의 결과를 달성
SEED-IV: 15명의 피험자가 각각 60초 동안 지속되는 40개의 비디오 클립을 시청하면서 얻은 EEG 기록으로 구성된 데이터 셋 → EEG 신호는 4초 세그먼트로 분리
제한된 양의 라벨이 부착된 샘플을 다양하게 사용하여 전반적으로 최상의 결과를 달성
SEED-V: 15명의 피험자가 각각 120초 동안 15개의 비디오 클립을 시청하면서 얻은 EEG 기록으로 구성된 데이터 셋 → EEG 신호는 4초 세그먼트로 분리
제한된 양의 라벨이 부착된 샘플을 다양하게 사용하여 두 번째로 좋은 결과에 도달에 도달
AMIGOS: 40명의 피험자가 각각 5분 동안 40개의 비디오 클립을 시청하면서 얻은 EEG 기록으로 구성된 데이터 셋 → EEG 신호는 20초 세그먼트로 분리
[ Valence ]
다양한 양의 제한된 라벨 표본을 사용하여 전반적으로 최상의 결과를 달성
[ Arousal ]
제한된 양의 라벨이 부착된 샘플을 다양하게 사용하여 두 번째로 좋은 결과에 도달에 도달
[ 결론 ]
이 연구에서는 뇌파 기반 감정 인식을 위한 새로운 준지도 방식을 제안한다. 제안한 프레임워크는 SEED, SEED-IV, AMIGOS(원자가)에서 라벨링된 6개의 모든 시나리오에서 평균 최고 결과를 달성했으며, SEED-V에서는 0.3%의 차이로 최고 결과에 근접한 것으로 나타났다.
모든 데이터 세트에 걸쳐 라벨링된 샘플의 수를 변화시키면서 제안한 방법에 대한 쌍별 표현 정렬의 영향을 보여준다. 준지도학습에서 쌍별 표현 정렬이 레이블이 지정된 표현과 레이블이 지정되지 않은 표현 사이의 거리를 상당히 줄여준다는 것을 보여주는 추가 분석을 수행한다. 라벨이 지정되지 않은 뇌파 데이터에서 강화학습보다 일관되게 우수한 성능을 보여준다.
→ Augmentation된 Dataset이 실제로 classification에서 유효하게 같은 class로 묶일 수 있는지에 대해 검증이 되지 않았음
자기주도학습은 라벨이 지정되지 않은 데이터를 활용하여 라벨이 지정된 대규모 데이터 세트에 대한 의존도를 완화하기 위한 좋은 방법이다. 이 논문에서는 자기주도학습을 발전시켜 더 좋은 결과를 낼 수 있는 방법을 소개한다.
목표: 자기주도학습의 새로운 알고리즘인 MixMatch 생성 및 평가
자기주도학습을 사용하는 이유?
→ 라벨이 있는 데이터를 수집하는데 비용과 시간이 많이 들기 때문
[ 자기주도학습의 기존 방법 ]
[ MixMatch ]
U: 라벨이 없는 데이터 / X: 라벨이 있는 데이터
[ 결론 ]
MixMatch가 연구한 모든 설정에서 다른 방법에 비해 오류율이 2배 이상 감소하여 현저하게 향상된 성능을 나타냄
기존의 affective computing을 위한 데이터베이스는 1) 얼굴 표정 분석에 중점을 두거나 2) 생리학적 신호에 기반하거나 3) 비디오 양식을 사용하였음. 이 데이터베이스는 기존과는 다른 개인 및 그룹에 대한 정서, 성격 특성 및 기분에 대한 멀티모달 연구를 위한 데이터 세트인 AMIGOS를 제시하였음.
이 논문 저자들의 목표: 개인의 성격과 기분, 사회적 맥락 및 비디오 길이와 관련해서 개인의 신경 생리학적 신호를 통해 정서적 반응에 대한 멀티모달 연구를 가능케 함
[ 수집 방법 ]
→ EEG, ECG, GSR 등의 생체 신호를 웨어러블 센서를 사용하여 기록하고 참가자의 정면 비디오와 깊이 전신 비디오도 녹화함
[ 특징 ]
[ 결론 ]
AMIGOS 데이터 세트가 개인 및 집단에 대한 감정, 성격 특성 및 기분에 대한 복합 연구에 사용될 수 있으며 EEG가 원자가 및 각성 예측에 가장 적합한 생리학적 양식인 것을 확인함