통계 언어 R을 활용한 서울특별시 범죄율의 사회적 변인 분석 프로젝트 (개인 프로젝트)
서울은 대한민국 이슈의 중심 무대인만큼 타 지역보다 월등히 높은 인구 밀도와 사회적 이슈의 파급력이 매우 크다.
이러한 사회적 맥락을 근거로 서울시의 범죄율과 범죄 예민도 또한 매우 높을 것이라는 가정이 합리적일 것임을 충분히 추론할 수 있다.
따라서 서울시에서 일어나는 5대 범죄를 예방하기 위 한 구체적 해결 방안을 마련하고자 범죄율에 영향을 끼치는 다양한 사회적 변인을 분석하는 개인 프로젝트를 진행하게 되었다.
이에 본 프로젝트에서는 5대 범죄와 조금이라도 관련이 있어 보이는 다양한 사회적 변인들을 조사하여 5대 범죄율과의 직접적인 상관성을 분석하고
사회적 변인들끼리의 상관성을 분석하여 간접적으로 5대 범죄율에 영향을 주는 변인을 선별한다.
그리고 각 변인별로 어떠한 상관관계가 있는지를 확인하여 서울시 범죄 예방을 위해 다양 한 관점에서 정책을 제시하고자 한다.
본 프로젝트는 빅데이터 분석용 도구인 R을 이용하여 서울지역을 중심으로 5대 범죄율에 영향을 끼칠만한 다양한 사회적 변인에 대해 총 범죄율과의 상관성을 나타내는 단순회귀분석과
각 사회적 변인 별 상관 관계를 나타내는 다중회귀분석을 활용하여 분석한다.
이 때 회귀분석 데이터 분석 결과를 설명하기 위해 p-value 값을 이용한다.
해당 프로젝트에서 추출되는 p-value 값이 0.05보다 작을 때 5대 범죄율(종속 변인)에 대해 그에 당응한 사회적 변인(독립변인)이 유의미하다고 판단할 것이다.
1. 단순 회귀 분석