[데이터분석] 인플레이션-발표편

정제철·2023년 7월 12일
0

빅데이터

목록 보기
17/17
post-thumbnail

📢데이터분석 및 데이터 시각화

파이썬을 활용하여 데이터분석 및 데이터 시각화 프로젝트를 진행해보자
데이터분석 프로젝트 - 인플레이션 발표편
데이터분석 프로젝트 - 미세먼지 발표편
데이터분석 프로젝트 - 인플레이션 분석편
데이터분석 프로젝트 - 미세먼지 분석편
데이터분석 프로젝트 - 주제선정


  • 발표에서 사용했던 ppt를 활용하여 프로젝트를 만들때 어떤 의도를 가지고 어떤 이유에서 만들었는지에 대한 자세한 이유와 시각화 방식을 사용한 이유에 대해 자세히 설명할 것이다.

'고인플레이션 시대에 대항하는 방법 : 투자'라는 주제로 데이터 분석 및 사각화를 진행하였는데 앞서 미세먼지에 관한 발표에 이어서 진행하는 것이었기에 청중들의 지친 마음을 달래고 주목을 끌어 관심도를 올려야했다. 그래서 환기의 목적으로 썸네일을 제작하였고, 이로 인해 관중의 흥미와 뒤에 나올 내용에 대한 궁금증을 유발하기 위해 썸네일을 제작하였다.

인플레이션에 대응하는 법 : 주식 투자로 주제를 선정했던 이유는 먼저 내가 관심을 가지고 평소에 흥미를 느꼈던 분야인 것이 첫번째였고, 그로인해 나의 분석 집중도가 높을거라고 예상했다. 그리고 청중에게 설명할때 나의 평소 배경지식을 통해 더 깊은 내용을 얘기할 수 있을 거라고 생각했기때문에 주제를 선정하였다.

📌분석 데이터

순서는 위의 순서대로 이루어지는데 여기서 눈여겨 볼점은M2통화지표, 생산자소비자물가지수, 환율, 지가지수 등의 경제지표를 분석하고 코스피, 코스닥 등의 주가지표와의 상관 관계를 분석하여 투자의 필요성을 도출했다는 점이다.
또한, 할로윈 투자 전략이라는 투자 전략을 소개하고, 백테스팅 기법을 통해 2000년부터 현재까지 23년 간의 누적 데이터에 할로윈 투자전략을 적용하여 그 성과를 6배의 누적 수익률로 입증하면서 마치게 된다.

사용한 기술스택과 프로젝트 기간과 인원에 대해 나타내고, 프로젝트의 목적은 인플레이션에 대항하는 주식투자라는 주제이다.
시각화를 위해 pandas와 matplotlib을 사용하여 선차트, 막대차트, 파이차트, 산포도 그래프 등을 사용하였고,
mplfinance 라이브러리를 이용하여 주가데이터를 캔들 그래프로 제작하였다.

데이터는 미세먼지처럼 하나의 총괄데이터를 가지고 전처리, 분석할수 있는 데이터가 없었기에 필요한 데이터를 다운받아 처리하였다. 그렇기에 경제지표부터 주가지표까지 많은 양의 데이터를 수집했고, 다 사용하지 않았지만 파일을 많이 다운받게 되었다.

주가데이터의 경우는 인베스팅닷컴에서 기간과 형식을 설정하여 다운 받았는데 내용의 형식은 위의 사진처럼 되어있었기에 따로 전처리를 할 필요는 없었다.

📌인플레이션의 심각성

먼저 인플레이션이 심각해지고 현금 가치가 떨어지고 있다는 전제에 대해 분석을 해야한다. 그리고 대비되는 자료를 통해 투자의 필요성을 입증할 것이기 때문이다.

M2통화지표(시장 현금유동량)를 통해 5년간 시장에 풀린 현금이 많아지고 있다는 점을 시각화한다. 그리고 생산자, 소비자물가지수의 급격한 상승과 같이 두어 상승하고 있는 인플레이션에 대해 시각화한다.

다음으로 생산자물가지수의 세부내용인 생필품물가지수를 그래프화하였다. 생산자물가지수라고 하면 와닿지 않는 사람들을 위해 직접 맞닿아있는 라면, 닭고기, 전기료, 도시가스, 난방비의 일상적인 품목을 통해 직접 와닿을 수 있도록 시각화하였다.

그리고 금리변화 그래프를 통해 인플레이션이 발생하여 그것을 잡기 위해 금리를 올리고있다는 그래프를 시각화하였다. 이는 반대로 생각하면 금리인상을 통해 인플레이션이 일어났다라는 사실을 전제로 만들어서 주장의 신빙성을 올렸다.

📌투자의 필요성

이제 인플레이션의 심각성과 현금 가치하락에 대해 시각화를 통해 표현했고, 그와 대비되는 투자종목들의 상승을 이유로 들어 투자를 통해 현금가치 하락을 방어해야한다는 내용을 시각화하였다.

지가지수를 통해 부동산의 상승을.. 코스피, 금을 통해 주가와 금의 가격또한 10년간 상승해왔다는 점을 시각화하였다.
10년동안 현금만 가지고 있었다면 10년간 주식, 금, 부동산을 가지고 있는 사람에 비해 큰 손실을 입은 것이다.

이제부터 투자 방법 중 하나인 주식투자에 대해 설명할 텐데. 그에 앞서 배경지식을 위해 투자자산 중 주식투자가 가장 많다는 것을 시각화하였고, 이제 후에 소개시켜드릴 내용은 상승이 대부분인 우량종목 코스피 종목을 위주로 소개할 것임을 시각화하여 설명한 것이다.

mplfinance 라이브러리를 활용하여 캔들 그래프로 만들어봤다. 이는 아까 원본데이터에 있던 항목이 모두 필요했기에 전처리할 것은 없었고, 날짜형식이 다르기 때문에 모든 파일에서 날짜형식을 통일 시켰다.

경제와 투자에 대해 관심이 없는 청중이 있을 수 있다. 그런 사람들은 이정도 깊이에 들어왔을 때 관심이 없기때문에 집중력을 잃어갈 시점이다. 그렇기 때문에 주식은 몰라도 삼성전자는 알기에 삼성전자로 다시 집중을 유도하고 선,막대그래프가아닌 산포도 그래프를 활용하여 상관관계에 대해 입증을 한다.

'삼성전자'와 '코스피' 두개의 파일에서 각자의 종가데이터를 추출하여 데이터프레임화 시키고, 이를 통해 산포도를 생성한다.

산포도 그래프의 특징인 1에 접할 수록 두 데이터가 일치한다는 것을 활용하여 삼성전자와 코스피의 일치성에 대해 시각화하였다. 그리고 두 데이터를 지수화하여 같은 지점에서 시작하고 둘의 지수를 맞춤으로 해서 좀더 잘 보이도록 시각화하였다.
그래프를 통해 코스피와 삼성전자가 많은 일치함을 보이고 있다.

📌실패하지 않는 투자법

이후부터 내용은 실패하지 않는 투자 전략에 대해 소개하게 될텐데 여기부터는 흥미있는 내용이기에 다시 관심도를 올리려 중간에 제작한 장입니다.
재무관리사가 되어 청중의 자산을 관리해드리겠다라는 의미로 제작하였으며 앞으로 나올 내용들은 모두 청중의 자산을 지키는데 유리할것이라는 내용을 함축하고 있다.

첫번째 투자 전략으로 절대 실패하지 않는 미국 빅테크 주식에 대해 소개했다. 최근 10년간 꾸준한 우상향을 하고 엄청난 성장을 하고있는 미국주식에 대해 시각화 하였고, 이를 통해 미국 주식 투자 전략에 대해 소개하였다.

다음으로 삼성전자와 코스피의 산포도를 통해 일치성에 대해 알아봤던 것에 반하여 환율과 코스피의 산포도 그래프를 사용하여 불일치성을 시각화할 것이다. 그이전에 두개의 파일에서 환율과 코스피의 종가를 추출하여 데이터프레임화 하고 이를 산포도로 표현하는 과정이다.

산포도 그래프를 보면 분산되어있는 것을 확인 할 수 있다. 양의그래프에서 많이 분산되어 있을 수록 일치율이 낮아지는데 표를 보고 확연히 다름을 느낄 수 있다.

이를 지수화하여 그래프로 나타내보면 둘 그래프의 상승과 하강의 주기가 반대함을 알수있다. 자세히 보면 환율이 올라가면 코스피가 내려가고, 코스피가 올라갈 때는 환율이 내려가는 것을 볼 수 있다. 이를 통해 환율이 올라간다는 뉴스를 접한다면 코스피가 반대로 떨어질 거란 얘기이고 이 반대도 수립하므로 이를 보고 투자에 뛰어들 시기를 정한다면 필승할 수 있는 투자전략이다.

마지막으로 할로윈 투자 전략이라는 투자 전략을 소개하고, 백테스팅 기법을 통해 2000년부터 현재까지 23년 간의 누적 데이터에 할로윈 투자전략을 적용하여 그 성과를 시각화하여 나타낼 것이다. 할로윈 투자전략이 무엇인가에 대해 소개하고 이를 백테스팅하는 과정을 소개한다.

백테스팅 기법을 사용하여 23년간의 데이터에 적용하여 할로윈 투자 전략에 맞추어 23년간 투자했다면 벌어들일 수익에 대해 분석하고 수치로 표현하였다. 그리고 각 년마다 수익률을 막대그래프로 시각화하였다.

막대그래프를 보면 빨강이 파랑보다 월등히 많고 그 높이 또한 높은 것을 확인할 수 있다. 이를 위해 막대그래프를 선택하였고, 횟수를 통해 78%라는 성공률을 수치화하였다.

마지막으로 11월이 아닌 다른 달을 모두 백테스팅 기법을 사용하여 분석하였고, 그냥 사면 오르는 것이 아닐까란 의문을 해소하였다. 1월부터 12월 달까지 같은 방식을 통해 모두 분석하였고 이를 막대그래프로 표현하였다.

그래프를 볼경우 11월이 제일 높은 것을 확인할 수 있으며 그와 정반대인 5월이 가장 낮음을 볼 수 있다. 5월을 통해 12배의 수익률을 올린 11월이 가장 성공률과 수익률 모두 높은 것을 표를 통해 알 수 있다.
이렇게 할로윈 투자 전략에 대해 마무리 하였다.


📢마치며

미세먼지 데이터와 다르게 인플레이션 데이터는 각 데이터를 찾아서 각 목적에 맞게 분석해야하는 점이 차이점이었다. 관심있는 분야였기에 조금더 힘을 내서 할 수 있었고, 짧은 프로젝트 기간동안 두가지의 프로젝트를 진행하기에는 시간이 부족했지만, 데이터분석 역량을 기르기 위해 잠을 줄여가며 열심히 하였다.

두가지 분야를 모두 데이터분석해보면서 한가지 데이터를 깊이 분석하여 여러가지 결론을 도출하는 방법과 여러가지 데이터를 분석하여 각 목적에 맞는 분석을 하는 방법으로 두가지 분석 방법에 대한 차이를 알게되었고, 각 시각화 방법 또한 다르다는 점을 알게되었다.

각 분야 별로 데이터 시각화 방법에 차별화를 두어야 시각화를 효과적으로 진행 할 수 있게 된다. 먼저 환경 데이터는 시간에 따른 환경 변화에 주안점을 둔 통시적 시각화가 효과적이었다. 이에 반해 금융 데이터는 백테스팅 기법을 통해 과거 데이터를 활용해 분석하여 누적 수익률 및 성공률로 입증했을 때 효과적이라는 것을 알게 되었다.

데이터 분석 프로젝트를 통해 데이터 분석과 시각화에 전문성을 키울 수 있는 좋은 경험이 되었고, 각 데이터 분야별 특성을 고려해 데이터 분석 방법을 다르게 해야 효과적이라는 것을 깨닫는 경험이었다.

profile
성공의 반대는 실패가 아닌 도전하지 않는 것이다.

0개의 댓글