1강Handcraft feature1\. 개별 노드를 설명하는 feature2\. 노드 쌍을 설명하는 feature3\. 전체 그래프의 topolopy structure을 설명하는 feature목표 : How do we make predictions for a set
Category Embedding 방식을 통해, 지정한 임의 차원의 벡터로 변환할 수 있다. Embedding Layer을 사용해야 한다. 물론 One-Hot Encoding 방식을 쓸 수도 있지만, 여기서는 벡터 임베딩 방식을 다룬다. Label Encoder를 통해
노드 분류, 엣지 예측, 그래프 분류가 추천 시스템의 영역에서는 각각 어떻게 활용될 수 있는지,프로젝트 설계에 기본 뼈대가 될 만한 내용을 정리해둔다.사용자의 선호도나 사용자 그룹을 분류하는 데 사용될 수 있다. 예를 들어, 각 사용자 노드가 '고객 세분화(Custom
학습을 끝낸 모델을 가지고 최종 예측을 추출하는 부분에서 'size miss' Runtime 에러가 발생한다면, 모델 구조와 파라미터의 저장 및 로드가 제대로 되었는지 점검해봐야 한다. 모델 구조를 저장한다는 것, 모델 가중치를 저장한다는 것, 모델 파라미터를 저장한다
TypeError: GraphSAGERegressor.forward() missing 1 required positional argument: 'edge_attr'train 함수 정의를 진행하며, edge_attr 전달에서 문제를 겪었다. 이 문제는 GraphSAGER
본문에 앞서, 어디선가 복붙해온 것은 하나도 없으며 모두 직접 작성했음을 미리 알린다.또한 개념 단어는 한국어, 영어 표기가 혼용되어 있다. 편의상 한국어로 더 많이 쓰고 있다.1st 시도 - train, test 로 원본 데이터 프레임을 분할한 후, 그것을 각각 별개
<현명한 문제 해결법> 코드의 일부 또는 전체 (특히 Error가 발생하는 부분):시도한 방법들에 대한 자세한 설명IndexError가 발생할 때의 오류 메시지, 스택 트레이스 등데이터셋에 관한 정보, 예를 들어 데이터의 구조, 크기 등
만약 회귀 예측을 목표로 하고 있다면, 전체 그래프에서 지역적인 이웃 정보를 사용하여 추론하는 작업이 필요하다. 그럴 때는 Data로 그래프를 구성한 뒤, DataLoader를 바로 사용해서는 원하는 결과를 얻을 수 없다. 아마도 수많은 인덱스 에러를 마주칠 것이다.
그래프 데이터도 배치 단위로 모델에 넣을 수 있다. DataLoader() 메서드를 사용하면 된다. 다시 말해, Graph Data를 모델에 넣기 위해서는 먼저 DataLoader를 설정하고, 그 다음 학습 과정을 구현해야 한다.DataLoader() 메서드는 기본 P
기본 GraphSAGE 모델은 노드 정보와 연결 관계를 기반으로 노드 임베딩을 학습하도록 설계되어 있습니다. 이는 많은 그래프 구조의 문제에 적합한 접근 방식이지만, 엣지 정보를 직접 활용하고 싶은 경우 기본 GraphSAGE 모델만으로는 부족할 수 있습니다.SAGEC
배치 정규화(Batch Normalization)은 모델의 학습 속도와 정확도를 향상시키기 위해 각 GraphSAGE 레이어 이후에 적용하는 정규화 기법이다.배치 정규화(Batch Normalization)는 딥러닝 모델의 학습 과정에서 가중치의 변화에 따른 활성화 출
Graph Data를 train-test 셋으로 나누는 가장 일반적인 방법은 노드 기반 분할(Node-based splitting)과 엣지 기반 분할(Edge-based splitting)이다.또한 Task마다 Graph 분할 방법은 그래프의 구조와 모델의 목적에 따라
Graph Data로도 교차 검증(Cross validation)이 가능하다. 다시 말해, 일반적인 ML 학습처럼 train-test 분할이 가능하다는 것이다. 여기엔 두 가지 방법이 있다.그래프의 일부 엣지를 테스트용으로 제거하고, 나머지 엣지를 사용해 모델을 학습한
표제어 추출이 완료된 'Book-Title' column을 벡터로 만드는 두 가지 방법이 있다.Label Encoder+Embeddign Layer : 하지만 각 책 제목을 하나의 벡터로 표현하기 때문에, 책 제목 내의 개별 단어들 사이의 관계를 고려하지 못할 수 있다
그래프란?개체와 관계, 상호작용을 묘사하고 분석하기 위한 언어. 네트워크와 관계로 세상을 정의한다.이 수업에서 다룰 주요 질문Relational Structure를 어떻게 활용하여 더 나은, 더 정확한 예측을 만들 것인가?그래프의 특징1\. 이미지 그리드나 텍스트와 같
본 포스팅에서는 GraphNN 모델을 연계해 성능을 향상시키는 방법에 대해 다룬다.정확히는 Node2Vec 모델과 GraphSAGE 모델을 함께 사용해 Graph 정보를 모델에 더욱 효과적으로 전달하는 방법론을 이론적으로 설명한다.node2vec과 GraphSAGE 모
이번 포스트에서는 Learning To Rank(LTR)에 대해 다뤄보고자 한다.Ranking 모델의 object function인 lambdarank도 다룬다. 추가 예정 : LambdarankNDCG 라는 optimization function에서 정확히 무슨
오늘은 추천 시스템 모델의 objective function과 밀접한 관계가 있는 point-wise와 pair-wise , list-wise에 대해 정리한다. 이들은 loss를 정의하는 방법들이다. Point-wise는 Loss function에서 한번에 하나
본 포스팅에서는 GraphSAGE 논문을 리뷰한다.단순히 논문의 내용을 번역하는 데에 그치지 않으며 내용에 더한 추가 설명과 개념을 정리한다. CS224W:GraphSAGE Neighbor SamplingDSBA Paper Review MultiSAGEGraph