Node-level Features: Characterize the structure and position of a node in the network
Node degree [Structure-based features]
Node centrality [Importance-based features]: 이웃 노드를 셀 때, 각 노드의 중요도도 함께 고려하는 방법
중요도란?
Clustering coefficient [Structure-based features]
사실은 삼각형의 갯수를 세는 것!
Graphlets [Structure-based features] 삼각형 말고, 미리 정의된 subgraph 형태의 갯수를 세는 것!
그 pre-defined subgraphs를 'Graphlets'이라고 한다.
Graphlet Degree Vector(GDV)을 node feature로 사용함. "Rooted at that node"
Link-level Features: Design features for a pair of nodes
Distance-based feature: 두 노드간 최단 경로의 길이
단점: neighborhood overlap의 정보는 사용되지 않음
Local neighborhood overlap: 두 노드 사이에 공유되는 이웃 노드의 갯수
cf. Adamic-Adar index: high deg의 common neighborhood이 많은 것보다 low deg의 common neighborhood이 많은 것을 더 크게 쳐줌
단점: 2-hop만 고려
Global neighborhood overlap: 전체 그래프를 고려함으로써 local neighborhood overlap의 단점을 극복
Katz Index: # of paths of all lengths btw two nodes (인접행렬의 n제곱으로 구함)
Graph-level Features: Design kernels instead of feature vectors
Kernel measures similarity between data