[R 범죄율 분석]1.프로젝트 개요

Yu River·2022년 6월 16일
0
post-thumbnail

서울특별시 범죄율의 사회적 변인 분석

통계 언어 R을 활용한 서울특별시 범죄율의 사회적 변인 분석 프로젝트 (개인 프로젝트)

프로젝트 배경

서울은 대한민국 이슈의 중심 무대인만큼 타 지역보다 월등히 높은 인구 밀도와 사회적 이슈의 파급력이 매우 크다.
이러한 사회적 맥락을 근거로 서울시의 범죄율과 범죄 예민도 또한 매우 높을 것이라는 가정이 합리적일 것임을 충분히 추론할 수 있다.
따라서 서울시에서 일어나는 5대 범죄를 예방하기 위 한 구체적 해결 방안을 마련하고자 범죄율에 영향을 끼치는 다양한 사회적 변인을 분석하는 개인 프로젝트를 진행하게 되었다.

개요

이에 본 프로젝트에서는 5대 범죄와 조금이라도 관련이 있어 보이는 다양한 사회적 변인들을 조사하여 5대 범죄율과의 직접적인 상관성을 분석하고
사회적 변인들끼리의 상관성을 분석하여 간접적으로 5대 범죄율에 영향을 주는 변인을 선별한다.
그리고 각 변인별로 어떠한 상관관계가 있는지를 확인하여 서울시 범죄 예방을 위해 다양 한 관점에서 정책을 제시하고자 한다.

분석할 사회적 변인 대상

사회적 변인 (사회적 활동과 관련)

  1. 재산세 : 경제적 지표를 나타낸다.
  2. 상주인구 : 한 지역에 늘 거주중인 인구 규모를 나타낸다.
  3. 인구밀도 : 면적 대비 인구수를 나타낸다.
  4. 유동인구수 : 도시 활성화 정도의 지표를 나타낸다.
  5. 청소년 인구 비율 : 전체 인구 비율 대비 청소년 인구수를 나타낸다.
  6. 고학력자 인구 비율 : 전체 인구 대비 대학 졸업자 인구수를 나타낸다.
  7. 유흥주점수 : 유흥 정도와 밀도의 지표를 나타낸다.
  8. 경찰수 : 치안의 정도를 나타낸다.

도시적 변인 (공간지리적 특성과 관련)

  1. 주택보급률 : 해당 지역이 주택가인지의 여부를 판단할 수 있는 지표이다.
  2. 숙박시설수 : 상시 거주가 아닌 외부인들의 유입률의 간접적인 지표이다.

활용 기술

1. 통계 언어 R

본 프로젝트는 빅데이터 분석용 도구인 R을 이용하여 서울지역을 중심으로 5대 범죄율에 영향을 끼칠만한 다양한 사회적 변인에 대해 총 범죄율과의 상관성을 나타내는 단순회귀분석과
각 사회적 변인 별 상관 관계를 나타내는 다중회귀분석을 활용하여 분석한다.

활용 방법 : 회귀 분석

이 때 회귀분석 데이터 분석 결과를 설명하기 위해 p-value 값을 이용한다.
해당 프로젝트에서 추출되는 p-value 값이 0.05보다 작을 때 5대 범죄율(종속 변인)에 대해 그에 당응한 사회적 변인(독립변인)이 유의미하다고 판단할 것이다.
1. 단순 회귀 분석

  • 단순 회귀 분석 방법을 활용해 하나의 독립변수가 하나의 종속변수에 어떤 영향을 끼치는지 예측하기 위한 회귀 모형을 만든다.
  • 아래는 해당 프로젝트에서 추출된 단순 회귀 분석 결과 중 하나이다.
    image
  1. 다중 회귀 분석
  • 다중 회귀 분석 방법을 활용해 여러개의 독립변수들을 가지고 종속변수를 예측하기 위한 회귀 모형을 만든다.
  • 아래는 해당 프로젝트에서 추출된 다중 회귀 분석 결과 중 하나이다.
    image
profile
도광양회(韜光養晦) ‘빛을 감추고 어둠속에서 힘을 기른다’

0개의 댓글