- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date | 21/05/15 23:26:37수정됨 |
Name | joel |
Subject | 축구로 숫자놀음을 할 수 있을까? 첫번째 생각, 야구의 통계. |
축구는 세계적으로 누리는 인기와 투입되는 자본에 비해 통계적인 분석과 접근이 대단히 더딘 종목입니다. 최근 들어서야 일반팬들에게 생소한 통계적 개념이 제시되고 분석이 행해지고 있으나 여전히 '축구는 숫자놀음이 아니다' 라는 말의 아성은 높기만 합니다. 그렇다면 왜 축구는 통계로 분석하기 어려울까? 숫자놀음을 할 수는 없을까? 하는 의문은 축구팬이라면 대부분 가져봤을 겁니다. 그 답을 얻기 전에 먼저 세계에서 가장 통계화가 발달한 종목인 야구에 대해 알아봅시다. 오늘날 야구에서의 숫자놀음은 아득히 발전했습니다. 수학자와 통계학자들이 동원되는 어엿한 전문가의 영역이죠. 어지간한 야구팬들조차 정확히 이해하기 힘든 알쏭달쏭한 스탯들이 넘쳐나고 이젠 아예 구단들이 내부적으로 쓰는 스탯은 공개하질 않습니다. 모든 선수, 모든 재능이 숫자에 의해 평가받는다 해도 지나친 말이 아닙니다. 이만한 숫자의 영향력은 축구는 물론이고 타 종목에 비해서도 압도적입니다. 야구는 왜 이런 게 가능할까요. 사람들은 야구가 투수와 타자의 1대1 대결이기 때문이라고 합니다. 물론 맞는 말이지만 이것만으로 '따라서 여타 팀 스포츠는 통계분석 안 됨! 땡!' 이라고 납득하고 돌아설 수는 없습니다. 엄밀히 말해 야구가 정말 1대1의 대결인 것도 아니고요. 좀 더 근본적인 종목의 특성을 짚어봅시다. 야구는 선수들을 정해진 위치에 두고, 일정한 규칙에 따라 특정한 행동(액션)을 할 것을 요구하며, 그 행동의 결과물을 객관적 지표에 의해 판정하여 하나의 사건(이벤트)으로 완결시킵니다. 그리고 시간이란 변수 없이 오로지 이벤트의 누적에 의해서만 경기가 진행됩니다. 그 판정에 있어 주관적 판단이 개입할 여지 또한 거의 없습니다. (물론 엄밀히 말하면 심판의 별모양 스트존이나 휘두르다가 멈춘 방망이를 스윙으로 판정할 것이냐 아니냐 하는 애매한 문제도 있긴 합니다만 야구에서 그리 비중이 크지는 않습니다.) 즉, 투수 타자는 정해진 위치에 섭니다. 모두가 동일한 조건이죠. 그리고 투수가 타자를 향해 공을 던집니다. 타자가 방망이를 휘둘렀나? 공이 방망이에 맞았나? 스트존에 들어왔나? 타자가 친 공이 타자가 1루로 도착하기 이전에 1루수 글러브에 들어갔나? 이런 기준에 의해 볼, 스트라이크, 안타, 범타 등등의 이벤트를 판정해서 볼이 쌓이면 출루, 출루와 진루가 쌓이면 득점, 스트라이크가 쌓이면 아웃, 아웃이 쌓이면 공수교대가 되죠. 여기에는 한치의 예외나 근사값도 있을 수 없습니다. 위에서 말했듯 이렇게 발생되는 이벤트는 거의 대부분 선수 개인의 역량에 의존하고요. 그리고 결정적으로, 야구는 경기 숫자가 매우 많습니다. 통계학자들이 너무나 사랑하는 많은 표본과 시행횟수를 안겨줄 수 있는 거죠. 어쩌다 한 두 번 나온 행운의 이벤트가 전체를 왜곡하기 어렵습니다. 그래서 과거 빌 제임스를 비롯한 세이버메트리션들은 자신들의 골방에 틀어박혀 기록지를 정리하는 것으로 선수들이 발생시키는 이벤트의 가치를 가늠하고 가공하여 줄 세울 수가 있었습니다. 무엇이 더 많은 점수를 낼 수 있는 이벤트인가? 무엇이 더 득점에 도움이 되는가? 어떤 선수가 더 가치있는 선수인가? 이런 의문들에 답을 끌어낸 사람들이 오늘날 야구단을 운영하는 중추에 들어가 있고요. 그리하여 현대 야구는 어느 정도 선수의 스타일을 초월한 줄세우기가 가능합니다. A: 전 안타를 잘 치고 도루를 잘 해요! B: 저는 안타는 좀 못 치지만 찍히면 넘어가요! C: 저는 볼넷을 잘 얻고 2루타를 잘 쳐요! 야구단: 응, 그래서 니네가 득점에 기여하는 거 점수로 환산하면 각각 몇 점? 이렇게 말이죠. 정리하자면 야구에서 통계화가 쉬운 이유는, 1. 선수들이 행하는 액션을 객관적 지표에 의해 이벤트로 완결시킨다. 2. 이벤트를 발생시키는 액션의 시작 위치가 고정되어 있으며 모두가 동등한 조건을 갖는다. 3. 2에 따라 이벤트는 선수 개인의 능력에 의해 발생한다. 4. 수많은 시행에 의해 3이 검증된다. 5. 같은 이벤트는 같은 가치를 가지며, 이벤트의 누적에 따라 경기가 진행된다. 대략 이렇게 압축해볼 수가 있겠습니다. 이 5개의 기준을 다시 한 번 야구에 겹쳐봄으로써 유효성을 검증해볼 수 있습니다. 야구에 혁명을 가져온 스탯캐스트가 등장하기 이전까지 야구 스탯의 정확성은 타자>투수>>수비였습니다. 타자의 경우, 세이버메트리션들은 자신들이 만들어낸 신뢰도 높은 스탯을 통해 기존에 사용되던 타율과 타점을 '간단한 맛에 보는 부정확한 지표' 쯤으로 밀어낼 수 있었습니다. 하지만 투수에 대해서는 FIP나 DIPS 같은 수치가 만들어졌음에도 스탯 자체의 결함이 밝혀지며 끝내 평균자책점의 아성을 확실히 무너뜨릴 스탯을 만들지 못 했으며, 야수들의 수비력을 재는 스탯은 암중모색 수준이었죠. 그 이유를 위의 기준을 통해 설명할 수 있습니다. 타자는 1~5의 조건에 거의 부합합니다. 모든 타자는 같은 자리 같은 조건에서 투수를 상대합니다. 안타를 치건 삼진을 당하건 그건 본인의 실력에 좌우되며, 밀어치건 당겨치건 홈런은 홈런이고 안타는 안타입니다. 부상만 아니라면 1년 내내 전 경기에 출전하는 것도 가능하기에 어쩌다 한 두 번 행운의 홈런이나 불운한 삼진콜을 당한다 해도 시즌 전체로 보면 운에 의한 영향을 덜 받습니다. 단, 어쨌거나 타자 역시 운을 비롯하여 자신의 실력과 무관한, 이벤트 발생에 영향을 끼치는 변수들을 가지고는 있습니다. 아무리 강타자라 해도 8명의 난쟁이와 함께하느냐 아니면 살인타선의 일원이 되느냐에 따라 성적에 영향이 없을 수가 없고 출루한 주자가 투수를 흔들어준다면 도움을 받으니까요. 다만 투수나 수비에 비하면 그 영향이 적습니다. 투수의 경우, 위의 5원칙 중 3과 5가 발목을 잡는 요소입니다. 3을 보자면 아무리 위대한 투수라도 잡아내는 아웃카운트의 태반은 삼진이 아니라 범타이며 공이 방망이에 맞은 후로는 야수들의 수비에 의존할 수 밖에 없습니다. 여기서 고민이 시작되죠. 범타로 잡은 아웃이라는 이벤트는 누구의 능력에 더 의존하는가? 투수인가, 야수인가? 각자에게 얼만큼의 지분이 있는가? 이것은 단순히 아웃카운트가 잡혔다 라는 이벤트만으로는 알아낼 수가 없었습니다. 이 문제를 해결하기 위해 인플레이 된 타구가 아웃이 될 확률을 계산하여 babip이란 스탯이 나왔고 추가 연구를 통해 타구의 아웃카운트 여부에 투수의 책임이 30퍼센트 쯤 된다는 사실이 밝혀졌지만 이 역시 투수의 피칭 스타일마다 차이가 존재하며 운과 수비 도움의 영역이 크기에 명확하게 그 지분을 수치화 할 수가 없었습니다. 5의 경우도 문제죠. 투수는 타자와 달리 발생시키는 이벤트의 총량이 아닌 순서에도 큰 영향을 받습니다. 같은 이벤트를 발생시켜도 결과는 전혀 다를 수 있습니다. 누구는 7이닝 2피안타 1볼넷 9k 완벽투를 펼치고도 2실점을 하는데 누구는 5이닝 6피안타 3볼넷 2k의 낙제점 투구를 하고도 무실점을 하는 일이 가능합니다. 이건 좀 극단적인 사례지만 이와 궤를 같이 하는 일들이 야구판에는 비일비재 합니다. 선발이 아닌 중간계투들은 시행횟수가 훨씬 적어서 더 심하고요. 다만 4의 원칙에 따라 충분히 긴 경력을 쌓은 투수라면 이런 외부요소들이 희석되어 통산 평균자책점이나 실점 같은 간단한 잣대도 쓸만한 도구가 되겠지만요. 투수보다 더 답이 안 나오던 수비의 경우 2,3원칙이 문제가 됩니다. 먼저 2원칙. 수비는 투수나 타자와 달리 위치가 정해져있지 않습니다. 대략적인 위치는 정해져 있으나 시프트에 따라, 개인의 개성이나 타구 판단에 따라 얼마든지 위치가 유의미하게 달라질 수 있죠. 공을 잡느냐 못 잡느냐를 결정하는 가장 큰 변수가 위치임을 고려하면 이건 꽤 큰 문제입니다. 이에 따라 3원칙 역시 문제가 됩니다. 수비하는 야수를 향해 날아오는 타구의 질은 야수 본인이 전혀 통제할 수 없습니다. 인간의 육신으로는 잡을 수 없는 공부터 정상적인 프로 선수라면 잡아줘야 하는 공까지 결코 평균화할 수 없는 천차만별의 공이 날아오는데 여기서 야수가 할 수 있는 일은 위에서 말한대로 위치를 조정하는 것밖에 없습니다. 설령 위치가 같다 하더라도 공이 얼마나 빨리 왔는지 궤적이 어땠는지에 따라서도 달라집니다. 공을 잡아서 던졌다 한들 받는 선수가 못 받으면 소용이 없기에 누구와 같이 콤비를 이루느냐도 은근히 영향을 미치구요. 내가 잘한다고 잡고, 내가 못 해서 못 잡았다고 하기엔 통제 불가능한 변수가 너무나 많아요. 축구에서 골 들어간 걸 가지고 이게 다 골키퍼가 못 막았기 때문이야! 라고 한다면 얼마나 억울하겠습니까? 타자는 못 칠 공이 오면 안 치면 되고(볼) 투수는 공의 질을 스스로 결정할 수 있는 것에 비하면 수비는 개인의 능력으로 뭘 해볼 수 있는 영역이 너무 좁습니다. 그래서 불방망이를 휘두르던 돌글러브 타자가 명예의 전당에 가기는 쉬워도 그 반대는 참 어려운 거겠고요. 세이버메트리션들은 어떻게든 수비를 계량화 하기 위해 종래의 방식을 벗어나 직접 수비를 보면서 새로운 방식으로 데이터를 수집하는 노력을 기울여 UZR 등의 스탯을 만들었지만 역시나 부정확한 건 마찬가지였죠. 이것이 기존의 세이버메트릭스가 갖는 어쩔 수 없는 단점이었습니다. 게임의 규칙 내에서 이벤트가 갖는 가치는 분석할 수 있었으나 그 이벤트 자체를 분해하여 명확하게 분석할 수는 없었습니다. 화물을 컨테이너 단위로 쌓아두면 아무리 많아도 수량만 가지고 쉽게 화물의 총량을 파악할 수 있지만 컨테이너 자체의 적재율이 0에서 100까지 제멋대로라면 그저 근사값을 동원할 수 밖에 없듯이 말입니다. 결국 이 문제는 첨단장비를 동원하여 이벤트가 발생하는 과정 그 자체를 추적하고 연구하는 스탯캐스트가 도입된 이후에야 해결됩니다. 자, 이렇게 해서 우리는 스포츠의 숫자놀음을 위한 조건들을 대강 알아낼 수 있었습니다. 그럼 이제 이 기준을 축구에 적용해 봅시다. 다음 글에서 말이죠. 16
이 게시판에 등록된 joel님의 최근 게시물
|