Kelec18to20

탁가이버·2025년 3월 7일
0

대선 결과 분석

목록 보기
17/18
post-thumbnail

18대, 19대, 20대 대선 분석 비교

주요 분석 개요

각 대선에서 K 값(특정 선거 패턴을 설명하는 지표)을 설명하는 요인들을 선형혼합모형(LMM)을 사용하여 분석함.
각 모델에서 주요 설명변수를 비교하고, 고령층 비율, 미분류표 비율, 스캐너 오류, 조작 가능성 등의 변수들이 선거 결과에 미치는 영향을 평가함.

1️⃣ 모델 적합도 비교 (REML Criterion & 잔차 분석)

대선REML Criterion (모델 적합도)잔차 최소값잔차 최대값지역별 랜덤 효과(분산)
18대 대선-243.4-2.492.990.01208
19대 대선-878.3-2.542.890.00004165
20대 대선-330.3-2.932.160.0203

🔹 해석:

  • REML 값: 19대 대선(-878.3)이 가장 낮음 → 모델이 데이터를 가장 잘 설명.
    • 18대(-243.4)와 20대(-330.3)에 비해 19대는 변수를 통해 K 값 변동을 효과적으로 설명했을 가능성이 있음.
  • 잔차 분석:
    • 18대: 최대값(2.99)으로 다소 높은 오차 존재.
    • 19대: 최소값(-2.54), 최대값(2.89) → 일부 이상치 존재.
    • 20대: 최소값(-2.93), 최대값(2.16)으로 예측 오차가 가장 적음.
  • 랜덤 효과 분석:
    • 18대20대 대선에서는 지역별 차이가 다소 존재.
    • 19대에서는 지역별 차이가 거의 없음(0.00004165) → 전국적으로 유사한 패턴을 보였을 가능성.

2️⃣ 주요 변수별 비교

변수18대 대선19대 대선20대 대선변화 경향
고령층 비율(2차 다항식)✅ 유의미 (-)✅ 유의미 (+)✅ 유의미 (-)19대에서 증가, 18·20대에서는 일정 수준 이상에서 감소
미분류표 비율❌ 유의미하지 않음✅ 유의미 (+)❌ 유의미하지 않음19대에서만 영향 있음
투표용지 설계 편향❌ 유의미하지 않음❌ 유의미하지 않음❌ 유의미하지 않음일관되게 영향 없음
스캐너 오류✅ 유의미 (+)❌ 유의미하지 않음❌ 유의미하지 않음18대에서 영향 있었으나 이후 약화
조작 가능성❌ 유의미하지 않음❌ 유의미하지 않음❌ 유의미하지 않음일관되게 영향 없음
고령층 비율 × 보수 성향✅ 유의미 (+)✅ 유의미 (-)❌ 유의미하지 않음18대에서는 K 증가, 19대에서는 K 감소, 20대에서는 영향 없음
보수 성향 × 미분류표 비율✅ 유의미 (-)✅ 유의미 (-)❌ 유의미하지 않음18·19대에서는 K 감소, 20대에서는 영향 없음

🔹 해석:
1️⃣ 고령층 비율의 효과 변화

  • 18대와 20대에서는 고령층 비율이 일정 수준 이상 증가하면 K 값이 감소.
  • 19대에서는 고령층 비율이 증가할수록 K 값도 증가하는 패턴.
  • 이는 18·20대에서는 고령층이 많을수록 특정 패턴이 약화되었고, 19대에서는 오히려 강화되었음을 시사.

2️⃣ 미분류표 비율의 영향력 변화

  • 18대와 20대에서는 미분류표 비율이 유의미한 영향을 주지 않음.
  • 19대에서는 미분류표 비율이 높을수록 K 값이 증가하는 경향이 나타남.
  • 이는 19대 대선에서 미분류표 비율이 특정 패턴과 연관되었을 가능성이 있지만, 18·20대에서는 해당 효과가 사라졌음을 의미.

3️⃣ 스캐너 오류의 영향력 감소

  • 18대 대선에서는 스캐너 오류가 많을수록 K 값이 증가하는 경향이 유의미했으나, 19·20대에서는 유의미한 영향을 보이지 않음.
  • 이는 전자개표기 및 투표 시스템이 개선되면서 기술적 오류가 선거 결과에 미치는 영향이 약해졌음을 시사.

4️⃣ 고령층 비율 × 보수 성향의 상호작용 변화

  • 18대에서는 고령층 비율이 높을수록 보수 성향이 강한 지역에서 K 값이 증가.
  • 19대에서는 반대로 고령층 비율이 높을수록 보수 성향이 강한 지역에서 K 값이 감소.
  • 20대에서는 유의미한 영향을 보이지 않음고령층의 투표 패턴이 점점 다양해지고 있음을 의미할 가능성.

3️⃣ 시뮬레이션 결과 비교

대선실제 K 평균시뮬레이션 K 평균오차(차이값)시뮬레이션 정확도 평가
18대 대선1.47261.4498-0.0228🔵 매우 정확함
19대 대선0.63710.8369+0.1998🟠 다소 높게 예측됨
20대 대선1.2711.411+0.140🟠 실제보다 높게 예측됨

🔹 해석:

  • 18대에서는 시뮬레이션이 실제 데이터와 거의 일치.
  • 19대에서는 시뮬레이션이 실제보다 다소 높은 값을 예측하는 경향.
  • 20대에서도 유사한 패턴이지만 19대보다는 개선됨.
    • 이는 19대 대선에서 K 값 변동을 설명하는 변수가 상대적으로 더 많았지만, 20대에서는 그 영향력이 줄어들었음을 의미.

4️⃣ 결론 및 시사점

1️⃣ 고령층 비율과 K 값의 관계는 대선마다 달랐으며, 19대 대선에서만 고령층 비율이 높을수록 K 값이 증가하는 경향이 나타남.

  • 18대와 20대에서는 일정 수준 이상 증가하면 K 값이 감소하는 패턴.

2️⃣ 미분류표 비율의 영향력은 19대 대선에서만 유의미했고, 18·20대에서는 영향력이 없었음.

  • 이는 특정 선거에서만 미분류표 비율이 중요한 역할을 했을 가능성이 있음.

3️⃣ 스캐너 오류의 영향력은 18대에서만 유의미했으며, 이후에는 더 이상 중요한 변수가 아니었음.

  • 이는 선거 관리 시스템의 개선과 관련이 있을 가능성이 있음.

4️⃣ 시뮬레이션이 전반적으로 높은 값을 예측하는 경향이 있으며, 특히 19대 대선에서 실제보다 과대평가되었음.

  • 18대에서는 정확했지만, 19·20대에서는 예측 오차가 증가함.

📌 최종 결론:
대선별 패턴이 변화하고 있으므로, 새로운 변수(예: 온라인 정보 소비, 정책 이슈별 반응 등)를 추가하여 모델을 개선할 필요가 있음.
전통적인 변수(고령층, 보수 성향 등)뿐만 아니라, 새로운 정치적 트렌드를 반영한 분석이 필요함!

profile
더 나은 세상은 가능하다를 믿고 실천하는 활동가

0개의 댓글

관련 채용 정보