- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date | 18/06/06 01:05:44 |
Name | 히하홓 |
File #1 | 1.PNG (116.2 KB), Download : 19 |
Subject | [진짜 통계의 오류] 설계의 오류 |
어떤 상황에서 실험, 조사를 하고 있다고 합시다. 변수는 3가지 C, T, K가 있고 Y라는 결과들을 조사할것입니다. 각 변수 C,T,K는 -(마이너스) 이거나 +(플러스)로 설정할수있습니다. 즉 변수마다 2가지의 수준이 존재합니다. 그러므로 총 경우의 수는 2^3=2*2*2=8이 나오겠지요. 그래서 총 8번 조사를 한 결과가 사진 1 가장 윗 사진 에 나와 있습니다. 각변수들을 -,+ 2가지 수준으로 나뉘기 때문에 각 변수들의 효과를 알아보기 위해 8개의 결과에서 C를 마이너스에서 플러스로 바꿨을때, Y의 변화량 4가지= ( 8 나누기 2) T를 마이너스에서 플러스로 바꿧을때, Y의 변화량 4가지= ( 8 나누기 2) K를 마이너스에서 플러스로 바꿨을때, Y의 변화량 4가지= ( 8 나누기 2) 을 정리한것이 사진1의 밑의 3 육각형입니다. 평균적인 각 변수들의 효과를 알아보려면 이 4개의 변화량의 평균값을 구하면 됩니다! 즉 변수 C가 마이너스에서 플러스로 변할때의 효과는 (-6-7-4-3)/4 =-5 가 되는 식이죠. 즉 해석 1: 변수 C가 마이너스에서 플러스로 변하면 y는 5만큼 떨어진다! 라고 해석하면 될것같습니다만.. 이러한 해석은 오류가 있습니다. 바로 이 효과들은 나머지 변수들을 고정시켰을때의 효과입니다! 즉 올바른 해석: 나머지 변수 (T,K)가 변하지않고 고정시켜놓고, C가 마이너스에서 플러스로 바꾸면 Y는 -5만큼 떨어진다! 가 올바른 해석입니다. 왜 그러냐고요? 변수 C와 T, K들은 interaction(교호작용,상호작용)이 있을 수 있기 때문입니다. 쉽게 적으면 T가 플러스일때 T가 마이너스일때에 따라 C의 변화에 따른 Y의 값의 변화량이 바뀔수 있기 때문입니다. (그림1의 우측 하단 그림에서 T가 마이너스일때는 K가 변하면 Y가 -8,-9 변화량이 감소하지만 T가 플러스일때는 Y가 증가함을 볼수있습니다. 이런 경우죠) 해석 1처럼 하고싶다면 다른 변수들의 상태가 어떻게 되든 변수 C의 효과가 항상 같다! 다시 말해 변수 C는 Y에 가법적으로 (additively)하게 영향을 미쳐야한다는 가정하 (사칙연산에서 곱셈은 곱해지는 수에 따라 효과가 바뀌지만 더하기는 뭐에 더하든 더하는 수의 효과는 같죠! ) 에서만 해석 1처럼 해석을 할 수있습니다. 진짜 하고 싶었던 말은 한국 국가 대표에서 탐욕을 부리는 손흥민을 뺀다면 손흥민에 몰린 수비덕에 좋은 활약을 보이던 선수가 부진한 활약을 보일수도 있다는 말을 적고 싶었네요 PS 혹시 여기 0
|