- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
| Date | 26/06/14 03:40:07 |
| Name | Memex |
| Link #1 | https://go.hibrain.io/s/hpLJGZgShpg4PkTGpXt2Y |
| Link #2 | https://github.com/anouny34/VoteTest |
| Subject | 6.3 지방선거 동일득표수의 우연성 검증 |
|
이슈를 모르시는 분을 위해 설명하자면 지방선거 1,2위의 득표수가 똑같은 상황이 다수 발생하여 이런 일이 발생가능한 확률에 대하여 논란이 있었습니다. 여기저기 검색을 하다가 좋은 글이 있어서 소개도 하고 약간의 보완도 할 겸 글을 적습니다. 링크1을 보시면 체계적인 방법으로 분석한 내용과 소스코드(링크2)까지 공개되어있습니다. 훌륭한 분석이 이미 있지만 검증을 위한 한 가지 아이디어가 떠올라서 AI를 돌려 코드를 수정하였습니다. "동일득표수가 자연스러운 현상이라면 모든 득표수에 랜덤하게 +1 or -1 처리를 하여도 비슷한 빈도로 동일득표가 발생할 것이다."를 가정하였습니다. 수정한 코드는 아래 링크입니다 https://pastebin.com/AQFA0VFs 결과는 다음과 같았습니다. 총 레코드: 7489 ====================================================================== [관내사전투표] 결과 비교 ====================================================================== 📌 순위쌍 (1, 2) (단위수=3731): - [원본] 지역구내 동일쌍: 4 | 전국풀링: 9 - [노이즈] 지역구내 동일쌍: 3 | 전국풀링: 10 - [변화량] 지역구내: -1 | 전국풀링: 1 -------------------------------------------------- 📌 순위쌍 (2, 3) (단위수=2498): - [원본] 지역구내 동일쌍: 12 | 전국풀링: 30 - [노이즈] 지역구내 동일쌍: 15 | 전국풀링: 38 - [변화량] 지역구내: 3 | 전국풀링: 8 -------------------------------------------------- 📌 순위쌍 (3, 4) (단위수=1731): - [원본] 지역구내 동일쌍: 232 | 전국풀링: 593 - [노이즈] 지역구내 동일쌍: 217 | 전국풀링: 622 - [변화량] 지역구내: -15 | 전국풀링: 29 -------------------------------------------------- ✨ 전체 득표벡터 완전일치 쌍 (지역구 내): - [원본]: 0 쌍 - [노이즈]: 2 쌍 (변화량: 2) ====================================================================== [선거일투표] 결과 비교 ====================================================================== 📌 순위쌍 (1, 2) (단위수=3758): - [원본] 지역구내 동일쌍: 2 | 전국풀링: 4 - [노이즈] 지역구내 동일쌍: 1 | 전국풀링: 7 - [변화량] 지역구내: -1 | 전국풀링: 3 -------------------------------------------------- 📌 순위쌍 (2, 3) (단위수=2498): - [원본] 지역구내 동일쌍: 14 | 전국풀링: 24 - [노이즈] 지역구내 동일쌍: 7 | 전국풀링: 14 - [변화량] 지역구내: -7 | 전국풀링: -10 -------------------------------------------------- 📌 순위쌍 (3, 4) (단위수=1731): - [원본] 지역구내 동일쌍: 119 | 전국풀링: 259 - [노이즈] 지역구내 동일쌍: 119 | 전국풀링: 278 - [변화량] 지역구내: 0 | 전국풀링: 19 -------------------------------------------------- ✨ 전체 득표벡터 완전일치 쌍 (지역구 내): - [원본]: 2 쌍 - [노이즈]: 0 쌍 (변화량: -2) 원본은 실제 투표자료를 이용한 결과값이고 노이즈는 랜덤하게 모든 득표수에 +1 혹은 -1을 시행한 데이터에서의 결과값입니다. 모든 값을 수정하였음에도 비슷한 수준의 동익득표가 발생하였습니다. 다음은 다른 수정값을 1000개를 만들어서 최소 ,최대 ,평균 ,표준편차를 구해봤습니다. 소스코드는 아래 링크입니다. https://pastebin.com/4FnX7XKt 결과값은 다음과 같습니다. ================================================================================ 📊 총 1000회 노이즈 시뮬레이션 결과 분포 요약 ================================================================================ 🟦 [관내사전투표] --------------------------------------------------------------------------- 📌 순위쌍 (1, 2): • 지역구내 동일쌍 -> [원본]: 4 | [노이즈 분포]: 평균=2.6 (최소=0, 최대=8, 표준편차=1.44) • 전국풀링 동일쌍 -> [원본]: 9 | [노이즈 분포]: 평균=8.6 (최소=1, 최대=18, 표준편차=2.60) 📌 순위쌍 (2, 3): • 지역구내 동일쌍 -> [원본]: 12 | [노이즈 분포]: 평균=13.9 (최소=4, 최대=25, 표준편차=3.53) • 전국풀링 동일쌍 -> [원본]: 30 | [노이즈 분포]: 평균=30.8 (최소=16, 최대=48, 표준편차=5.20) 📌 순위쌍 (3, 4): • 지역구내 동일쌍 -> [원본]: 232 | [노이즈 분포]: 평균=218.8 (최소=176, 최대=267, 표준편차=14.03) • 전국풀링 동일쌍 -> [원본]: 593 | [노이즈 분포]: 평균=604.1 (최소=537, 최대=678, 표준편차=23.76) ✨ 전체 득표벡터 완전일치 쌍 (지역구 내): • [원본]: 0 쌍 • [노이즈 분포]: 평균=0.5 쌍 (최소=0, 최대=3, 표준편차=0.67) --------------------------------------------------------------------------- 🟦 [선거일투표] --------------------------------------------------------------------------- 📌 순위쌍 (1, 2): • 지역구내 동일쌍 -> [원본]: 2 | [노이즈 분포]: 평균=1.5 (최소=0, 최대=6, 표준편차=1.12) • 전국풀링 동일쌍 -> [원본]: 4 | [노이즈 분포]: 평균=4.0 (최소=0, 최대=11, 표준편차=1.84) 📌 순위쌍 (2, 3): • 지역구내 동일쌍 -> [원본]: 14 | [노이즈 분포]: 평균=13.4 (최소=4, 최대=28, 표준편차=3.27) • 전국풀링 동일쌍 -> [원본]: 24 | [노이즈 분포]: 평균=19.7 (최소=9, 최대=35, 표준편차=4.06) 📌 순위쌍 (3, 4): • 지역구내 동일쌍 -> [원본]: 119 | [노이즈 분포]: 평균=124.1 (최소=91, 최대=158, 표준편차=10.64) • 전국풀링 동일쌍 -> [원본]: 259 | [노이즈 분포]: 평균=276.0 (최소=223, 최대=342, 표준편차=16.04) ✨ 전체 득표벡터 완전일치 쌍 (지역구 내): • [원본]: 2 쌍 • [노이즈 분포]: 평균=0.6 쌍 (최소=0, 최대=3, 표준편차=0.72) --------------------------------------------------------------------------- 1000회 랜덤화를 통한 결과를 보았을 때 이번 선거의 동일득표수 현상은 정상범위 안에 있다고 볼 수 있습니다. 3
이 게시판에 등록된 Memex님의 최근 게시물 |
|

