Internship Week 17 : Recap & Plan

Yelim Kim·2023년 12월 3일
0

Internship

목록 보기
18/22

Recap of Accomplishments

2023-11-27

  1. 저번주에 데이터 보니까 Solar_radiation값 비어있는곳이 있어서 최박사님 데이터중에 비어있는 곳 찾아서 메꿨다....

  2. 그래프 데이터 구축 - 미완성...

  3. 하지만 내가 하려는 걸 완벽히 이해했다!
    일단 'Temporal'이라는 게 있는데 여기서 아이디어를 얻었다.
    저건 사실 시계열에서 쓰이는거지만, 내 문제는 시계열이 아니므로 .. 어떻게 응용할지 생각해봤다.

    급하게 PPT로 그려봤는데, 사실 저 Node를 뭐로 할지 정말 오래 고민했다. GraphCast는 노드를 지역으로 했는데, 그럼 뭔가 지역간의 상관성이 나타나는거니까. 그런데 내가 하는 일은 영암만 학습한 다음에, 다른 지역을 Test하는 것이기 때문에 적합하지 않다고 판단했다.
    그래서 노드를 날씨 변수로 설정하였고, Node Feature에는 해당 timestep의 해당 변수 값, 그리고 Edge Feature에는 변수와 변수 사이의 상관계수값을 넣는 걸 계획했다.

사실 그래프 네트워크문제는 여러가지 Task를 할 수 있는데, 많이 쓰이는 것이 1. 그래프 분류 2. 노드 분류 3. 링크 예측 등으로 내가 하려는 것과 살짝 다른 느낌이다... 그래서 관련 자료를 찾는데 너무 많은 시간을 허비한 듯...

2023-11-29

  1. 원하는 대로 그래프 데이터 구축했다.
  2. 12월부터 대역2 기말준비
  3. 교수님과 면담했다.
  • 일단 과제는 없어졌다고 하셨다... 뭐 사실 그거 상관 없이 하고있던 거니까 ㄱㅊㄱㅊ
  • 면담 후 주원언니랑 같이 일정과 할일을 상의했다.

12월 : 예림) 태양광 끝 + 초안까지, 주원) 기말고사 열심히 준비
1월: 주원+예림) GraphCast vs. Pangu vs. Kim + Kaggle 대회 끝
2월: 주원) 태풍 끝+ 초안까지

2023-11-30

  1. 결과는 나왔는데, 로스값이 2000이 넘어간다...
    어쨌든 코드 이상은 없는 것 같은데 아무래도 데이터 모양이 살짝 이상한 것 같아서 수정하기로 했다.
  2. KIST 워크샵
  • 강박사님과 많은 얘기를 나누었다. 기상학회에서도 뵙고 정말 인상깊다고 생각했었는데 이렇게 다시 뵙게 되서 너무 반가웠다,,, 그리고 같이 연구하고 방학때마다 정기적으로 가서 미팅을 했으면 좋겠다는 생각을 언니랑 같이 했다.

2023-12-01~12-03

주말을 이용하여... 이번주 내로 무조건 GNN돌리고 가겠다는 생각을 했다..... 하 무조건 해.....

인터넷에 이것저것 찾아도 하... 도저히 비슷한 코드가 없었다. 논문은 많은데 코드는 안주고..;;;; 진짜야 가짜야?????
암튼 그래서 결국 처음부터 내가 한다 마인드로 그냥 아예 쌩 처음부터 그래프 파기로 결정
왜냐면 일단 구조는 있는데 , 코드를 어떻게 짜는지 몰랐던 거니까 일단 대충 다른 코드 건들다 보면 나오겠지 라는 마인드...

우선 아까 위에 그렸던, 내가 생각했던 구조대로 데이터를 커스텀하여 구축했고,


각 노드당 피쳐는 한개, 그리고 노드는 9개. 총 엣지는 72개인데, 이게 자기 자신을 포함하지 않아서 일단은 72개이고... 자기 자신을 포함하고 싶은데 일단 이건 패스
2014년부터 2022까지 총 78841개의 타임스탭이므로 78841개의 그래프가 그려진다.

그 다음으로 가장 기본적인 GCN구조를 가져와서 모델을 구축했다.

처음에 노드 피쳐개수 안맞아서 그거 맞춰주느라 좀 애먹음... ㅠㅠ

암튼 그리고 그렇게 학습을 시켜줬더니

100개 도는데 엄청 오래 걸린다... 아직 결과는 안나와서 봐야 알겠지만 그래도 첫번째 시도(망함) 보다 좋은 결과가 나와서 다행... 이번주 안으로 최종 결과는 아니지만 그래도 결과가 나왔다...

머신러닝 모델 MAE가 0.14정도였으니까 이거랑 비슷하면 될듯 !!!!!
에폭 100 도는데 꽤 오래 걸려서...
아 그리고 서버로 돌리려고 하니까 깔고싶은 패키지가 안깔려서 자꾸 캐글로 돌리게 되는데ㅠㅠ 다음주에 와서 다시 서버로 돌려봐야겠다
에폭 500정도 돌리면 코랩 서버가 터져서...

암튼 보람찬 일주일이었다...
다음주는 대역2 기말준비 해야되는데,,, 음.........

Next Week's Agenda

  1. 그래프 Test Set까지 돌려보고 선형모델, 머신러닝 모델, 딥러닝 모델 비교 끝내기
  2. 머신러닝 모델 뜯어서 Loss function 커스텀해보기 -> 많이 좋아질 것 같음.
profile
뜬금없지만 세계여행이 꿈입니다.

0개의 댓글