[4차 산업혁명 기반] 2023년 창의융합인재양성 공모전

김은서·2023년 11월 27일
0

컨퍼런스, 공모전

목록 보기
2/2
post-thumbnail

😀참여 계기

학교 친구들과 어떻게 하면 2학기를 알차게 보낼 수 있을까 얘기를 나누다가 공모전에 나가면 좋을 것 같다는 결론이 나왔다. 마침 학교에서 다른 학교와 함께하는 공모전을 개최한다는 공지가 떴고 우리는 한달동안 공모전을 준비하였다.


😭힘들었던 점

공모전을 준비하면서 힘들었던 점이 한 두개가 아니다.

1. 주제 정하기

"The first step is always the hardest." "시작이 반이다."

공모전에 나가자! 친구들과 호기롭게 시작했지만 막상 하려니 주제 정하는 것부터 난관에 봉착하였다. 요즘 사회 이슈이면서 자료를 찾기가 쉬워야 하고 우리들이 즐겁게 할 수 있는 주제를 찾으려니 여간 힘든 게 아니었다. 그렇게 여러 의견이 나오고 우리가 정한 주제는 "지방 도시의 산후조리원 폐업률과 발전 가능성"이다.

2. 데이터 분석

다행히 주제와 관련된 데이터를 찾는 일은 순조로웠지만 데이터를 분석하는 과정은 역시 힘들었다. 파이썬으로 데이터를 분석하는 법을 따로 배운 적이 없기 때문에 주어진 자료에서 어떻게 데이터를 가공하고 정제해야 내가 원하는 정보를 얻을 수 있는지가 관건이었다.

[사진 -1]은 행전안전부에서 제공한 전국산후조리원표준데이터 엑셀의 일부분이다.

사진-1

문제는 데이터의 양이 너무 많고 각 산후조리원 위치를 광역시별로 정리되어 있지 않아 손쉽게 광역시별 산후조리원 개수를 알아낼 수 없다는 것이다. 또한 각 컬럼별 (내용이 있는) 셀의 개수도 달라 결측값을 제거하는 작업도 필요했다.

a. 내가 선택한 해결방법

부끄럽게도 내가 선택한 해결방법은 엑셀 함수로 광역시별 산후조리원 휴업·폐업(직권폐업)·영업 개수를 일일이 구하여 따로 새로운 엑셀([표 -1])로 정리하는 것이다. 이때 기존 엑셀에서는 충청북도와 충청남도로 나뉘어 있기 때문에 이 두 구역의 값을 충청도로 합하는 과정 또한 엑셀 함수로 구하였다. 경상북도·경상남도, 전라남도·전라북도도 마찬가지이다.

[표-1]

workingclosedclosingtotal
강원도1810028
경기도1481363287
경상도4142083
광주광역시86014
대구2424048
대전823031
부산2325251
서울1171024223
세종6208
울산7209
인천2320144
전라도2517143
제주712019
충청도2325049

이런식으로 일일이 데이터를 입력하다보니 원하는 정보 하나를 얻는 데 시간이 굉장히 오래 걸렸다. 굉장히 비효율적인 방법이다. 그러나 이 당시에는 이 방법이 최선의 방법인 줄 알았다.

b. 친구가 선택한 해결방법

df['시'] = df['소재지전체주소'].str.split(' ', n=1).str[0]

df['시'] = df['시'].replace(['경상남도', '경상북도'], '경상도')

df['시'] = df['시'].replace(['전라남도', '전라북도'], '전라도')

df['시'] = df['시'].replace(['충청남도', '충청북도'], '충청도')

total_count = df.groupby('시')['영업상태명'].count().reset_index(name='전체 수')

closed_count = df[df['영업상태명'] == '폐업'].groupby('시')['영업상태명'].count().reset_index(name='폐업 수')

merged_df = pd.merge(total_count, closed_count, on='시')

merged_df['폐업률(%)'] = (merged_df['폐업 수'] / merged_df['전체 수']) * 100

반면 친구는 replace()를 활용하여 경상남도·경상북도 값을 한번에 경상도로 대체시켰고 groupby()를 이용하여 그룹별 즉 광역시별로 나누고 count()로 산후조리원 폐업 개수를 구하였다.


😊좋았던 점

왜 나는 파이썬 메소드로 내가 구하고자 하는 값을 얻으려는 생각을 하지 못했는지 모르겠다. 만약 팀이 아닌 나 혼자 공모전을 준비하였다면 여전히 비효율적인 방법으로 시간 낭비를 하고 있었을 것이다.


🏆장려상

1차 심사 결과에 합격했다는 연락이 왔다. 확인해보니 정말이었다. 2차 심사를 위해 PPT 발표 영상을 제출해야 하는데 제출 마감 당일에 메일을 열람해 급작스럽게 만들었다.
1차 심사 결과

그래서 그런 걸까. 아쉽게도 우리 팀은 장려상을 수상하였다. 물론 데이터 분석 양이 부족했거니와 자료 준비도 미흡했다. 서로 시간이 맞지 않아 일주일에 한 번밖에 만나지 못한 게 가장 큰 이유이기도 하다. 이번달 교내 공모전이 열리는데 이 친구들과 다시 참가하기로 하였다. 분야는 마찬가지로 데이터 분석이다. 이번에는 일주일에 두 번 만나며 장려상을 받은 아쉬움을 기반으로 더욱 철저히 준비 중이다. 꼭 좋은 결과가 있기를 바란다.

profile
은서는 오늘도 개발 중💻

0개의 댓글