옆동네에서 엄청난 댓글이 달린 글 중의 일부분입니다.
(3할을 치는 선수가 앞 두타석에 무안타 후 등장) XXX선수는 앞 두타석에 안타를 못쳤으니 이번
타석에 안타를 칠 확률이 높습니다.
그럼 2타수 무안타의 타자(타율 3할)가 3번째 타석에서 안타를 칠 확률을 얼마일까요
네 너무 당연하게도 30%입니다.
음...그런데 이게 사실 너무나도 당연한건 아닙니다.
그냥 막연히 생각해도, 긴장감도 다르고,상대하는 투수도 달라졌거나, 같은 투수라도 공 던진 갯수에 따라
던지는 공의 위력이 달라졌을 수도 있고, 등등 여러가지 변수가 있죠.
그래서 이런 경우에 "독립성 검정"을 해보면 됩니다.
Fisher라는.유명한 낚시꾼 통계학자가 만든 방법이 있지요.
한국데이터정보과학회지에 실린 논문이 하나 있더군요.
"프로야구 경기에서 안타의 독립성에 대한 연구" http://dx.doi.org/10.7465/jkdi.2013.24.6.1421
각 타석에서의 결과를 바탕으로 특정 타석의 안타 여부가 이전 타석의 결과와 관련성이 있는지 아니면 독립인지 알아보기 위하여 안타에 대
한 조건부 확률이 조건이 없을 때의 타율과 같은지를 살펴보고, 리프트를 이용하여 특별한 특징이 있는지 확인하고, 독립성검정 (Fisher, 1925)을 이용하여 각 타석에서의 결과가 종속이라고 할 수 없음을 밝히고자 한다.
결론만 말하자면 반전은 없스빈다.
결론적으로 특정 타석의 안타 여부와 이전 타석의 안타 여부는 독립이거나 관련성이 아주 작다고 볼
수 있다. 본 논문에서는 제시하지 않았지만 경기 출전수가 많은 40명의 선수들에 대해서 그리고 타석이
아닌 타수를 기준으로 한 경우에도 전체 선수를 이용하여 타석에 대해 분석한 경우와 흡사한 결과를 얻
었다. 따라서 각 타석 또는 타수에서의 안타 여부는 서로 독립이라고 보아도 무방할 것으로 사료된다.
그런데 정말 우리가 알고 싶은것은 타자의 안타 가능성을 예측하는 모형이긴 합니다.
그 모형을 예측하려면 예상가능한 변수를 다 때려부어서 만들어야 하긴 하겠죠.
포지션, 이닝, 타석, 타수, 지난 경기의 타율 등...
이걸 만들어서 성공하면 비더레의 레전드가 되는겁니다 ^^;
PS1: 논문은 전문을 첨부했습니다!