[CS224W] 5. Message Passing and Node Classification

Cherish·2023년 2월 5일
0

CS224W

목록 보기
5/7
  • Semi supervised node classification : 라벨링된 노드와 그렇지 않은 노드를 동시에 사용하는 분류문제
  • Message Passing 방법을 통해 노드 간의 correlation (dependencies) 을 가정하여 레이블을 예측한다.

🔨 Correlation

비슷한 노드는 직접적으로 연결되어 있거나 근접한 위치에 존재한다는 의미로, 주변 노드가 같은 레이블에 속할 때 상관관계가 존재한다고 말할 수 있다.

✔️ Homophily

개인들이 비슷한 특징을 가지는 타인들과 서로 연결되고 함께 행동하려고 한다는 개념.

✔️ Influence

사회적으로 연결된 개인 간에는 서로 영향을 주고 받으며 비슷한 특징을 가지게 된다는 개념.

🔨 Motivation

  • Similar nodes are typically close together or directly connected in the network.
  • Classification label of a node v in network may depend on
  1. Features of v = 노드 v의 변수들
  2. Labels of the nodes in v's neighborhood = 노드 v의 이웃 노드들의 레이블
  3. Features of the nodes in v's neighborhood = 노드 v의 이웃 노드들의 변수들

🔨 Collective Classification

✔️ 3 steps

  • Local Classifier : Initial label assignment
    노드 피처를 기반으로 레이블을 초기화한다.
  • Relational Classifier : Capture correlations
    이웃 노드의 피처와 라벨 정보로 노드 간 상관관계를 파악한다. 이웃노드의 레이블,변수와 현재 노드의 변수를 이용해 현재 노드의 레이블을 예측한다.
  • Collective Inference : Propagate the correlations
    Collective Classification은 특정 조건을 만족할 때까지 각 노드에 대해 분류하고 레이블을 업데이트한다. 한번의 예측으로 종료되는 것이 아니다. 이때의 조건이란 더이상 레이블이 변하지 않거나나, 정해진 횟수를 의미한다. 동일한 변수를 가진 노드라도 그래프 구조에 따라 최종 예측이 달라질 수 있다.

🔨 Relational Classification

  • v의 이웃노드들의 클래스 확률(class probability Yv)들의 가중평균으로 v노드의 클래스 확률을 구한다.
  • 레이블이 없는 노드는 Yv를 0.5로 초기화 한다.
  • 업데이트가 반복적으로 진행되어 모든 노드에 대해 수렴하거나 반복횟수에 도달할 경우 멈추게 된다.

🔨 Iterative Classification

  • Relational Classification : 노드의 label과 edge같은 정보만을 활용하고 attributes, features 등 노드의 속성은 고려하지 않는다.
  • Iterative Classificatio : 노드의 feature 정보 f(v)와 이웃 노드의 라벨 z(v)을 기반으로 해서 노드를 분류한다.

Reference

https://www.youtube.com/watch?v=6g9vtxUmfwM&list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn&index=14

0개의 댓글