비슷한 노드는 직접적으로 연결되어 있거나 근접한 위치에 존재한다는 의미로, 주변 노드가 같은 레이블에 속할 때 상관관계가 존재한다고 말할 수 있다.
개인들이 비슷한 특징을 가지는 타인들과 서로 연결되고 함께 행동하려고 한다는 개념.
사회적으로 연결된 개인 간에는 서로 영향을 주고 받으며 비슷한 특징을 가지게 된다는 개념.
- Similar nodes are typically close together or directly connected in the network.
- Classification label of a node v in network may depend on
- Features of v = 노드 v의 변수들
- Labels of the nodes in v's neighborhood = 노드 v의 이웃 노드들의 레이블
- Features of the nodes in v's neighborhood = 노드 v의 이웃 노드들의 변수들
✔️ 3 steps
- Local Classifier : Initial label assignment
노드 피처를 기반으로 레이블을 초기화한다.
- Relational Classifier : Capture correlations
이웃 노드의 피처와 라벨 정보로 노드 간 상관관계를 파악한다. 이웃노드의 레이블,변수와 현재 노드의 변수를 이용해 현재 노드의 레이블을 예측한다.
- Collective Inference : Propagate the correlations
Collective Classification은 특정 조건을 만족할 때까지 각 노드에 대해 분류하고 레이블을 업데이트한다. 한번의 예측으로 종료되는 것이 아니다. 이때의 조건이란 더이상 레이블이 변하지 않거나나, 정해진 횟수를 의미한다. 동일한 변수를 가진 노드라도 그래프 구조에 따라 최종 예측이 달라질 수 있다.
https://www.youtube.com/watch?v=6g9vtxUmfwM&list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn&index=14