오늘은 컬럼들의 의미에 대해서 중점적으로 찾아보았다!
일단 TOPIS에서 받은 MONT_LINK파일에 있는 'LINK_ID'는 표준링크아이디였다...!
계속 헷갈려서 조금 뻘짓하다가 다시 원상태로 돌아오긴 했다.
dropna를 해준 '표준링크아이디'가
요런식으로 되어있는 것을 알 수 있다.
이것을 해결해주기 위해
pd.options.display.float_format = '{:.5f}'.format
이걸 입력해주니
이런 실수 형태로 바뀌었다.
(아이코 실수🤭 포항항~(^o^)~)
dtype
로 형태를 확인해보니
표준링크아이디는 float
다른 값은 int이므로
astype
으로 맞춰주면
mapping_df.astype({'표준링크아이디':int})
깔끔하게 정리된 것을 알 수 있다!
이제 어느정도 형태는 다 맞췄으니 필요한 컬럼만을 남겨주어야 하는데...
교통에 대해 조금 무지해서 많은 고민을 했다😅
맨 처음에는 필요한 것들이 많이 없을 것이라 생각했다.
그래서 왜 이 정보데이터를 불러온거지 싶어서 오빠와 얘기를 해보니 그제서야 필자는 이해했다.
저런 정보들이 하나하나 모여서 결과값을 내는데에 도움이 되니까 많을수록 좋을 것이다!
이걸 읽고 필요한 컬럼들을 꾸려보았다.
확인해보니 'REST_H'열과 'REST_W'열은 모두 0이므로 사용할 필요가 없겠다 싶어 제거해주었다.
그리고 링크아이디를 사용하므로 노드아이디도 삭제해주었고, 비고(REMARK)와 서비스링크와 표준링크아이디를 연결해주는 '표준링크순서'도 지워주었다.
그렇게 해서 깔끔하게 정리가 됐다!
링크정보를 속도데이터와 교통량데이터에 더해줄 것이다.
그리고 어떤 모델이든 한번 돌려보는 것이 나의 목표!
오늘 하루 끝-