Internship Week 1 : Recap & Plan

Yelim Kim·2023년 8월 11일
0

Internship

목록 보기
1/22

Recap of Accomplishments

2023-08-07

교수님과 면담

  • FCN 으로 태풍 연구
  • 태양광 발전량 예측 연구
  • 목표는 없고 하고싶은거 마음대로
  • FCN 돌릴 서버 얻어주신다고 하셨음
  • 11월 학회에서 포스터 발표 OK 9월 제출
  1. 서버 기다리는 동안 태양광 발전량 예측 연구를 진행해보기로 했다.
  2. 관련 논문 찾아봄
  3. 결론
  • 모듈 온도, 밤시간 빼고, 좋은 모델 찾아보자.

2023-08-08

  1. 랩실 서버 사용하는 방법, 서버에서 py파일 수정 및 실행, 데이터 옮기기 배움
  2. '모듈 온도'가 들어가 있는 데이터가 하나밖에 없음
  3. 일단 위 데이터 서버에 다운받아서 csv파일 싹 합치고 한국어 인식을 못해서 인코딩 해줌
  4. 귀찮아져서 셀 이름 영어로 바꿈

2023-08-09

  1. 지역별 날씨 데이터 추가했다.
  2. 데이터에 대해 이 데이터를 쓰는게 맞을까 생각이 들어 최정박사님께 메일을 보냈다.
  3. '모듈 온도' 데이터가 들어가있는 파일을 찾았다.
  4. 최정 박사님께서 메일 답장을 주셨는데 내가 확인을 못하고 퇴근했다.
  • 다른 박사님들께서 발표 이후에 FCN관련 피드백을 많이 주셨다.
    • 모델끼리 멀티 모델 앙상블을 해봐라 ex) GC+FCN
    • 실제 태풍에 집중해서 JMA랑 비교했을 때 얼마나 잘 맞추는지 확인해봐라
      • 특히 2개의 태풍이 같이 올 때도 잘 맞추는지 궁금하다
    • 변수 하나를 평균값으로 바꿔서 확인한다음에 해당 변수가 전체 태풍 경로 예측에 얼마나 영향을 주는지 확인하기
  • 서버 받기 전에 FCN 연구 전체적으로 어떻게 할지 계획을 세워야할듯

2023-08-10

  1. 최정 박사님께 조언을 받았다.
    - 데이터는 다시 고르는게 좋겠다고 하심.
    - 한국서부발전(주)_신재생에너지발전량 여기서 데이터 다운받음
    - 생각하고 있는 아이디어는 좋은 것 같고, 모듈 온도 대신 2mT를 넣으면 어떨까? & 미세먼지 변수를 넣으면 좋겠다 하셔서 넣어보기로 함
    - 사용한 발전소는 전남 영암군 삼호읍 포뮬러원(F1)경주장 앞 주차장에 설치되어있는 발전소
    - 관련 기사가 있어서 찾아봤다

    영암의 13.5MW급 태양광발전소는 226k㎡
    신성솔라에너지의 255W 모듈이 7.5MW 설치되고 솔라파크의 모듈이 6MW 설치된다.
    특히 신성솔라에너지의 255W 모듈(PVCPM-2-0702)은 동급 모듈로는 최대 출력을 자랑한다. 총 2만8405장이 설치됐다.  솔라파크의 태양광 모듈은 250w급이며 2만3736장이 설치됐다.
    RPS에 따르면 발전사들은 전력생산량의 일정비율을 신재생에너지로 생산해야한다. 올해 목표는 2%로 2020년까지 11%를 달성해야한다.
    발전소가 본격적으로 가동되면 약 5000가구에 전력이 공급될 수 있다. 전력 생산량은 연간 1만8000MWh.

  2. 기상청 종관기상관측(ASOS) 데이터 다운
  3. ERA5에서 d2m t2m 다운
  4. 기상청 황사관측(PM10) 미세먼지 데이터 다운
  1. 각 데이터끼리 합치고 필요없는 변수 제거하기
  2. 간단한 시각화해서 보니 연도별로 규칙성이 없었다. -> 제외함

    박사님께서는 "2020년에는 역대 가장 길었던 장마영향인 것 같고, 2015년도 11월에 비가 많이 왔다고는 하는데 영암지역도 그런지는 더 확인해봐야 할 것 같아요.." 라고 하셨다.
    - 왜 그런지 확인해보고 중요한 변수때문이면 그 변수도 고려해보자

2023-08-11

  1. 아침에 박사님께서 월별 데이터도 보고싶다고 하셔서 메일 보내드렸다.

    그래도 경향성을 띈다. 4-5월에 발전량이 많고, 겨울철에 적게 나옴.

    년도별로 보면 2020년 7월, 2014년 8월, 2016년 10월, 2015년 11월. 에서 조금 값이 튄다.
    - 그렇게 튀는 값 아니고 강수량 같이 학습시키니까 놔둬도 될 것 같다 판단했음.

  2. 세 종류 데이터 시간 기준으로 싹 합침

  3. 비어있는 NaN값들이 있어서 시간 기준으로 보간법 적용해서 값 채워넣음
    Before:

    After:

  4. 강수량이나 강설량에서 NaN은 없다는 뜻이니까 0으로 채워넣음

  5. EDA & VISUALIZATION -> 계속 분석 중

  6. train, valid, test로 나눠놓고 모델 돌릴 준비 끝냄

Next Week's Agenda

  • 모델 돌리기
    • 머신러닝 모델 -> GRU -> Transformer 순으로 돌리면서 비교
    • GRU까지는 논문이 있음
    • Transformer는 그냥 예상인데... 왠지 GRU보다 좋을수도 있을 것 같아서 도전
    • 이외에 가능한 실험들 :
      1) L1 regularity 부여
      2) LightCTS
      3) Bi-RNN
  • FCN 돌릴 서버 기다리기
profile
뜬금없지만 세계여행이 꿈입니다.

0개의 댓글