LEAF : A Benchmark for Federated Settings

Sungchul Kim·2022년 4월 3일
0

Federated-Learning

목록 보기
5/5
post-thumbnail

오늘은 LEAF라는 library에 대해 소개하도록 하겠습니다. LEAF는 realistic한 benchmark dataset을 제공합니다. 링크는 다음과 같습니다.

LEAF

Summary

  • Wearable 기기, iphone같은 mobile device는 매일 방대한 양의 데이터를 생산
  • Realistic한 benchmark data가 필요한 시점
  • Federated Learning에 적합한 benchmark framework제안(LEAF)
  • LEAF : open-source federated datasets, evaluation framework포함

우선, library설명에 앞서 federated learning종류에 관해 살펴보도록 하겠습니다. federated learning은 크게 horizontal/vertical로 구분됩니다.

Horizontal Federated Learning

Figure 1. Categorization of Federated Learning. a) Horizontal federated learning.

  • 개개인(each client)이 가지는 data는 같은 feature space에 존재함.
    • Client A / Client B (Mnist/Mnist)

Vertical Federateed Learning

Figure 2. Categorization of Federated Learning. b) Vertical federated learning.

  • 개개인(each client)이 가지는 data는 서로 다른 feature space에 존재함.
    • Client A / Client B (Amazon/IMDB)

개별 client가 가지는 mobile device data는 다르기 때문에, vertical federated learning이 좀 더 realistic setting이라는 생각이 듭니다.

LEAF benchmark

다시 돌아와서, LEAF library가 가지는 dataset에 대해 설명하도록 하겠습니다. LEAF는 dataset을 호출하면 전처리 후 standardized format으로 변환시켜주는 역할을 합니다.

Figure3. Statistics of datasets in LEAF

Data Description in LEAF

LEAF는 총 5가지 데이터셋을 가지고 있습니다. 하나씩 살펴보도록 하겠습니다.


Conclusions

  • 일반적으로 여러 paper에서 mnist, cifar10를 많이 사용하는 것을 볼 수 있음.
  • 본 연구에서는 좀 더 realistic한 benchmark data를 담고 있는 LEAF제안.
profile
김성철

0개의 댓글