각 대선에서 K 값(특정 선거 패턴을 설명하는 지표)을 설명하는 요인들을 선형혼합모형(LMM)을 사용하여 분석함.
각 모델에서 주요 설명변수를 비교하고, 고령층 비율, 미분류표 비율, 스캐너 오류, 조작 가능성 등의 변수들이 선거 결과에 미치는 영향을 평가함.
대선 | REML Criterion (모델 적합도) | 잔차 최소값 | 잔차 최대값 | 지역별 랜덤 효과(분산) |
---|---|---|---|---|
18대 대선 | -243.4 | -2.49 | 2.99 | 0.01208 |
19대 대선 | -878.3 | -2.54 | 2.89 | 0.00004165 |
20대 대선 | -330.3 | -2.93 | 2.16 | 0.0203 |
🔹 해석:
변수 | 18대 대선 | 19대 대선 | 20대 대선 | 변화 경향 |
---|---|---|---|---|
고령층 비율(2차 다항식) | ✅ 유의미 (-) | ✅ 유의미 (+) | ✅ 유의미 (-) | 19대에서 증가, 18·20대에서는 일정 수준 이상에서 감소 |
미분류표 비율 | ❌ 유의미하지 않음 | ✅ 유의미 (+) | ❌ 유의미하지 않음 | 19대에서만 영향 있음 |
투표용지 설계 편향 | ❌ 유의미하지 않음 | ❌ 유의미하지 않음 | ❌ 유의미하지 않음 | 일관되게 영향 없음 |
스캐너 오류 | ✅ 유의미 (+) | ❌ 유의미하지 않음 | ❌ 유의미하지 않음 | 18대에서 영향 있었으나 이후 약화 |
조작 가능성 | ❌ 유의미하지 않음 | ❌ 유의미하지 않음 | ❌ 유의미하지 않음 | 일관되게 영향 없음 |
고령층 비율 × 보수 성향 | ✅ 유의미 (+) | ✅ 유의미 (-) | ❌ 유의미하지 않음 | 18대에서는 K 증가, 19대에서는 K 감소, 20대에서는 영향 없음 |
보수 성향 × 미분류표 비율 | ✅ 유의미 (-) | ✅ 유의미 (-) | ❌ 유의미하지 않음 | 18·19대에서는 K 감소, 20대에서는 영향 없음 |
🔹 해석:
1️⃣ 고령층 비율의 효과 변화
2️⃣ 미분류표 비율의 영향력 변화
3️⃣ 스캐너 오류의 영향력 감소
4️⃣ 고령층 비율 × 보수 성향의 상호작용 변화
대선 | 실제 K 평균 | 시뮬레이션 K 평균 | 오차(차이값) | 시뮬레이션 정확도 평가 |
---|---|---|---|---|
18대 대선 | 1.4726 | 1.4498 | -0.0228 | 🔵 매우 정확함 |
19대 대선 | 0.6371 | 0.8369 | +0.1998 | 🟠 다소 높게 예측됨 |
20대 대선 | 1.271 | 1.411 | +0.140 | 🟠 실제보다 높게 예측됨 |
🔹 해석:
1️⃣ 고령층 비율과 K 값의 관계는 대선마다 달랐으며, 19대 대선에서만 고령층 비율이 높을수록 K 값이 증가하는 경향이 나타남.
2️⃣ 미분류표 비율의 영향력은 19대 대선에서만 유의미했고, 18·20대에서는 영향력이 없었음.
3️⃣ 스캐너 오류의 영향력은 18대에서만 유의미했으며, 이후에는 더 이상 중요한 변수가 아니었음.
4️⃣ 시뮬레이션이 전반적으로 높은 값을 예측하는 경향이 있으며, 특히 19대 대선에서 실제보다 과대평가되었음.
📌 최종 결론:
✅ 대선별 패턴이 변화하고 있으므로, 새로운 변수(예: 온라인 정보 소비, 정책 이슈별 반응 등)를 추가하여 모델을 개선할 필요가 있음.
✅ 전통적인 변수(고령층, 보수 성향 등)뿐만 아니라, 새로운 정치적 트렌드를 반영한 분석이 필요함!