- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date | 17/09/27 02:51:36 |
Name | 다시갑시다 |
Link #1 | https://www.youtube.com/watch?v=jFyr0oVJSXE |
Subject | 스탯 오브 운빨망겜: 축구 오브 통계 |
몇일간 생각만하던걸 글로 무작정 적어보았습니다. 그러다보니 글이 굉장히 길어져서 짤방을 마구 투척했습니다. 그랬더니 길이만 더 길어졌네요. 어쩌지... 에라이 모르겠다, 짤방이랑 짤방설명만 읽고 댓글 다셔도 괜찮습니다. 어차피 운빨망겜인데 가볍게 가볍게가요 1. 축구는 운빨망겜이다 부자가 프리미어리그 우승컵을 들어올린 이색적인 경력의 슈마이켈 부자 (아버지 피터가 왼쪽, 아들 캐스퍼가 오른쪽) 예전에 탐라에서도 한번 얘기했던적이있는데, 15-16시즌 영국프리미어리그 우승팀인 레스터 시티의 골키퍼는 캐스퍼 슈마이켈이라는 선수입니다. 이 선수는 스스로도 훌륭한 키퍼이지만, 아무래도 아스톤 빌라와 맨체스터 유나이티드에서 활약했던 아버지 피터 슈마이켈이 더 전설적인 선수입니다. 조금 더 비교를해보자면 아들은 캐스퍼는 지난 5년여간 프리미어리그 정상급 골키퍼를 이야기하자하면 "아 그래 캐스퍼는 언급해줘야하는 좋은 키퍼야" 이런 수준이고, 아버지 피터는 지난 25년여간 프리미어리그 최고의 골키퍼를 이야기하자하면 (빠심 반영해서) "일단 피터를 박아두고 다른 선수들을 비교해보자" 이런 수준입니다. 우리나라의 차두리/차범근 부자지간과 비슷하다고 생각합니다, 아들도 훌륭한 선수인데, 아버지가 사기캐인거죠 ㅋㅋ 그런데 골키퍼로서 캐스퍼가 아버지 피터보다 확실히 뛰어난 스탯이 하나 있습니다. 바로 맨체스터 유나이티드의 홈구장인 올드 트래포드에서 pk 방어죠. 지난달 루카쿠의 pk를 막아낸 캐스퍼는 올드 트래포드에서 pk 방어시도 1회차에 1회 선방, 선방율 100%의 빛나는 기록을 지니게 되었습니다. 전설인 아버지 피터의 기록은? 3회 시도해서 3회 실패 = 0%... 뭐 그 누구도 이걸보고 골키퍼로서 "캐스퍼>피터"라고 진지하게 주장할리는 없는 그냥 잡다한 트리비아용 스탯입니다. 하지만 이 스탯이 전 축구에서 상당히 중요한 요소를 보여준다고 생각합니다. 바로 [운빨]이요. 캐스퍼가 피터보다 올드 트래포드 pk 방어 스탯이 훨씬 좋은 이유는? 프로레벨에서 pk가 나오는것 자체가 굉장히 예외적인 일이니까라 스탯의 오차범위가 어마어마한거죠. 단순하게 말하면 [그냥 캐스퍼가 운이 좋았던거죠]. 올드 트래포드 pk방어율 0%의 피터 슈마이켈의 가장 유명한 pk 세이브. 홍차넷의 베르기/아스날팬들에게 미리 죄송하단 말씀을... 맨빠는 안합니다. 많은 축구팬들은 인정하지 않을수도있지만, 축구는 운이 엄청 중요한 게임입니다. 경기결과는 득점으로만 결정하는데, 골 넣기가 더럽게 힘드니까 어쩔수가 없죠. 지난 몇십년간 유럽 메이저 프로축구리그들의 총 경기당 평균득점이 3.00을 넘은적이 없을겁니다. 그러니까 평균적으로 경기중에 2~3골 사이가 난다는건데, 2:0, 3:0보다는 1:1, 2:1이 훨씬 흔한 점수죠. 좀 씨니컬하게 말하자면 프로축구는 90분동안 22명 + a가 도합 백몇십km 뛰어서 슈팅한번 뽀록나기를 기대하는 스포츠인겁니다. 우리가 뽀록이 터지면 승점을 쌓는거고, 상대가 뽀록 터지면 승점을 잃는거에요. 근데 이 경기결과 하나에 걸린게 워낙에 크다보니까 골 하나하나에 목숨걸고 뛰죠. 이렇게 소중한 골을 만들어내는 프로세스가 원하는만큼 정제된것도 아니라는 사실은 축구에서 운의 영향력을 더 크게 만들죠. 뭐 세부적인 공격전술이니, 세트피스이니, 조직력이니, 스타 플레이어니 맨날 얘기하지만 결국에 골을 넣는 마지막 순간은 거의 전적으로 슈팅을 때리는 선수의 개인적인 기지와 결국엔 운의 영향이 꽤큽니다. 뭐 예전엔 가끔씩 해설에서도 하는 말로 "정확하게 맞은 슈팅보다는 살짝 빗맞아야 수비랑 키퍼가 예상을 못해서 골이 더 잘들어간다." 이게 따지고보면 검증이 안되는 이야기겠지만 축구에서 운이 골에 미치는 영향력에 대한 느낌은 아주 잘 표현한다고 생각합니다. 실제 사례를 보자면 메시의 2015년 코파 델 레이 결승에서의 골을 분석해보면. 메시의 발과 볼의 임팩트 지점이 1.5mm만 옆이였어도 득점이 안되었을거라고합니다. 달리면서 슈팅된 이 볼의 속도가 약 시속 77km 정도로 강한슈팅이였는데 아무리 기술적 신체적 차원이다른 축구를 하는듯한 메시라고해도 저 동작들을 1mm 단위로 완벽하게 통제한다고 볼수는 없을겁니다. https://www.youtube.com/watch?v=jFyr0oVJSXE 언급된 메시의 골 ESPN 분석영상 좀 더 극단적이고 우스꽝스러운 예들을 생각해보면 프로경기에서 유효슈팅을 하나도 못때렸는데 득점을 한다던가, 관중석에서 날라들어온 풍선에 공이 굴절되서 득점을 한다던가, 수비수가 준 백패스를 키퍼가 헛발질해서 골이 들어가던가, 헤딩하려고 멋지게 날아왔는데 무릎이나 어깨맞고 들어간다거나... 아니면 역으로 수비수 다 재끼고 빈골대에서 홈런을 찬다던가, 넣으라고 주는 패널티킥을 말도안되는 실수로 날린다던가... 몇년째 축구를 본팬들은 이런 장면들을 꽤 보셧을겁니다 (한번밖에 못본것도 있을수있습니다). 물론 축구는 인간이 하는거니까 저럴수있습니다. 근데 저거 때문에 경기의 승패가 결정된다는건 기술/전술적으로 누가 잘난지 대결을하자는 취지가 중요한 프로스포츠에서 꽤 당황스러운 변수입니다 (위의 예시중에 승패에 영향을 끼치지 않은 예시가있는것 같지만 무시를... 특정팀이 연속으로 까인것 같다는 기분이 드시면... 그거 그냥 기분입니다 기분). 2. 운빨망겜을 모델링해야한다!! 스포츠 산업에서 요즘 핫한 주제중 하나는 데이터화/통계화입니다. 근데 축구는 대표적으로 이 트렌드에 늦는편입니다. 미국에서 시작된 이 트렌드가 유럽/남미가 주무대인 (애초에 보수적인) 축구산업이 더 둔감하게 반응한다는 이유도있지만, 다른 이유에는 타 스포츠에 비해 축구는 통계의 신뢰도가 절대적으로 떨어지는것도 중요합니다. 뭐 단순이 2차, 3차 인덱스 개발이 안되서라기보다는, 애초에 저런게 개발이 더 힘들다는거죠. 승패에 절대적 결과를 미치는 골은 워낙에 희귀한 일이다보니까 예측모델의 정확도에 필연적 한계가있습니다. 축구에서 골의 분포는 굉장히 대표적으로 푸아송 분포를 따르는데요... 이거 푸아송이 처음에 어떤 문제를 고민하다가 푸아송 분포를 찾았는지 읽어서 비교해보면 꽤 웃깁니다. 일정기간 동안 골이 얼마나 나올지는 예상이 가능하지만, 각 골이 언제 어떻게 나올지 예측이 힘든게 포인트입니다. 그런데 그렇다면 골 자체는 아니라도 골을 만드는 프로세스라도 판단을 할수있으면 도움이 될겁니다. 그걸 표현하고 싶어서 일반적으로 많이 거론되는 지표들이 [점유율], [유효슈팅수] 같은거고, 조금 더 나아가면 [공격진형 패스수], [패킹 지표], [골 기대값] 뭐 이런거죠. 후자의 지표들이 전자보다 더 세련된 정보를 제공하지만, 저것들을 기준으로 팀들을 줄세워보면 실제순위 리스트와 맞지 않는 부분들을 꽤 많이 발견할수있습니다. 이를보고 일각에서는 "봐라 축구는 그깟 숫자나부랭이 표현할수 없는 고결한 스포츠다, 스탯충들 ㅉㅉ"라고 까겠지만 개인적으로는 "하, 이 더러운 운빨망겜 같으니라고, 일 복잡하게 만드네"가 더 난것같습니다. 운빨망겜들 분석해보겠다고 매년 모여서 학회까지하는 충들.jpg 슬프게도? 통계적으로 단순 깔끔하게 설명되지 않을수록 통계의 중요성은 더 올라갑니다. 근대 통계학은 천문학자들이 처음으로 사용되었다고합니다. 옛날 천문학자들이 자기들이 망원경으로 관측한 별이랑 행성들 위치자료 가져와서 서로 비교해보니까 이게 댕댕이 놀이터였다고합니다. 천체들은 지구에서 보기에는 굉장히 작은 점들이다 보니까 이게 관측방법이나 환경이 조금씩만 바뀌어도 결과가 막 요동을 쳣었던것같아요. 그래서 천문학자들이 내린 결론이 "야 이거 관측 하나하나는 도대체 뭐가 뭔지 알수가없다, 이제부터는 관측자료 여러개 모아서 평균을 비교하자" 였다고합니다. 개별근거의 신뢰도가 떨어지니 (통제/예측이 힘든 운이 득실득실하니) 통계모델을 사용하자!였던거죠. 현대과학도 비슷합니다. 물리/화학/생물학 중에서 빅데이터, 통계모델링에 가장 집착하고 가장 발달한 분야가 어딜까요? 물론 세부적인 디테일에 따라서 차이는 있지만 보통 생물학쪽이 가장 민감하고, 그 다음에 화학, 물리학 순서라고 봅니다. 생물학쪽 실험들이 변수통제가 더 힘들고 개별적 실험결과의 신뢰도가 떨어지니까 오히려 자신의 가설과 연구의 신뢰도를 입증하기 위한 노력이 배로 필요한거죠. 저희과가 굉장히 짬뽕스러워서 물리학에 치우친 연구부터 생물학에 치우친 연구까지 여러가지가 골고르게 존재합니다. 그렇기 때문에 디파트먼트 내부세미나에서 생물학쪽 친구들이 발표하면 매번 놀리는 래퍼토리 또한 같습니다. "응?? 모델에 대한 fit이 0.65이라고? 님 이거 쌩구라 아님? ㅋㅋㅋㅋ 난 0.9 나와도 실험 다시해야할 기세인데 ㅉㅉ" (물론 순수물리학쪽에 치우친 실험들도 뜯을래면은 하루종일 굶은 성장기 아이들앞의 갈비찜처럼 미친듯이 뜯길수있습니다). 하지만 현실은 생물학쪽 친구들이 0.65 얻을라고 데이터 뽑고 돌리고 모델링하고 돌리고 또 돌리고 데이터 또 뽑고한 노력투자는 후자가 거기에 투자한것보다 훨씬 많을겁니다. 물리쪽이야 모델들이 워낙에 깔끔하고 실험의 통제도 쉽다보니까 데이터 프로세싱에 신경을 쓸 필요성이 적죠 (상대적으로). 요즘 핫한 메타스터디가 어느필드에 많이 적용되는지 생각해보셔도됩니다. 물리학이나 화학쪽에서는 메타스터디가 그렇게 핫하지 않아요. 개별적 실험의 신뢰도가 상대적으로 높으니까요. 짤 제목: [p=0.06일때]. 본격 이과망해라를 유도하는 짤 통제/예측이 안되는 요소가 많아서 복잡할수록 (막말로 운빨일수록) 개별적인 근거의 신뢰도가 떨어지고, 그렇다면 신뢰도를 높히기 위한 통계모델이 오히려 더 중요해지는거죠. 일상에 조금 더 가깝게 다가오는 비유를 들자면, 기상예보가 괜찮지 않을까 싶습니다: [비가 언제 어디에 올지]라는 좀 식상한 정보를 제공하는데 필요한 변수의 개별적 신뢰와 통제가 힘들다보니 계속 더 좋은 슈퍼컴퓨터와 더 복잡한 기상모델을 찾게되는거죠. 이정도면 제가 운빨망겜이라고 표현하는 축구의 통계화에대한 스탠스가 어떠한지 다들 감이 오실거라고 생각합니다. 복잡하고 더럽고 힘든 문젠데, 그러니까 최소한의 합리적 논의를 위해서는 오히려 여기에 더 투자를해야한다는거죠. 이것도 안하면 아무말 대잔치가 되니까요. 3. 이남자 군대 안가서 군대얘기는 못하는데 축구얘기만하네... 그런데 이게 축구에 관심이 없는 사람들에게도 시사하는 점은 무엇일까요. 굉장히 클리셰하지만 "축구(또는 다른 그 어떤 스포츠든) 삶과 똑같다"라는 말이 표현한다고봅니다. 제가 통계모델의 중요성을 이야기하면서 하드 사이언스쪽 이야기만했는데, 사회과학쪽에서도 통계모델이 점점 중요해지고있죠. 이유는 비슷하겠죠, 힘들지만 이것도 안하면 근거의 베이스가 너무나도 달라서 논의자체가 부정확해질 가능성이 높으니까요. 다시 축구로 돌아가서 이 이야기를 조금 더 발전 시켜보겠습니다. 이건 저도 생각이 계속 변하는 부분인데, 여타 다른 스포츠들과 마찬가지로 축구는 통계모델로 단순히 설명할수 없다고 생각합니다. 축구 통계화의 논의가 세이버매트릭스 초기의 '출루율' 처럼 하나의 [갓(god) 지표]로 표현되는 승리방정식을 찾으려는 경향이 은연중에 있다고 생각합니다. 복잡한 문제를 단순화 시켜서 깔끔하고 직관적인 해결법을 찾는건 굉장히 큰 카타르시스를 느낄수있는 매력적인 루트임은 분명합니다. 그런데, 그 답이 존재한다는 보장은 없지 않을까요? 복잡한 문제는 복잡한 답이있는게 더 자연스럽지 않나요? 특히나 프로세스에서 결과의 연결이 통제가 잘안되는 시스템에 하나의 갓솔루션을 찾는건 성배를 찾기위한 여정과 비교할수있겠죠. 축구 통계가 발전하는건 좀 더 전체론적인 발전 방향성을 지녀야한다고봅니다. [좋은축구가 무엇이냐]라는 질문에 최소한 복수정답이 인정받는 축구판에서 [좋은축구를 표현하는 하나의 갓지표]를 찾는건 이상한 접근법이죠. 단순히 통계모델의 발전뿐만 아니라, 그 통계치가 의미하는 것이 정확히 무엇이고, 그로 인해서 우리가 축구에 지니고있는 어떠한 정확한 질문/가설을 그 통계치가 어떻게 지지/반박하는지 담론 자체가 변화해야겠죠. 그리고 그러다보면 다분히 추상적인 [좋은축구] 보다 더 날카롭고 더 명확한 사고와 질문을 해야하는거죠. 그리고 그 질문은 축구라는 큰 문제의 일부분에 대해서 답을 제공할겁니다. 그러한 답들을 여러가지를 모으고 정제해서 [특정한 목적의식을 지닌 축구]라는 하나의 크고 복잡한 문제에 대한 답을 하나를 제시할수있는거죠. "어떤사람들은 축구가 삶과죽음의 문제라고 생각합니다. 제가 확실히 말씀드리죠, 축구는 그보다 훨씬 심각한 문제입니다." 전설적인 축구감독 빌 샹클리의 말 우리삶의 중요한 문제들도 비슷하다고 생각합니다. 삶은 축구보다 훨씬 더 복잡하고 운빨이 강하게 작용하는 경우도있는 정말 난해한 문제입니다. 근데 그런 삶이 몇천만, 몇십억이 엮여서 문명과 사회를 구성하죠. 정말 드럽게 복잡하고 노답인 상황이죠. 하지만 오히려 그렇기에 우리는 아마 더 노력을 해야하는거라고 생각합니다. 이 복잡한 상황에서 조금이라도 확실히 건저낼려면 우리 모두가 노력을 많이해야하는거죠. 그 노력의 방향성을 최대한 근거있게 설정하기위해서 각종 지표가 중요한거고요. 하지만 축구와 마찬가지로 큰그림을 보는게 중요하다고 생각합니다. 우리삶/사회의 문제의 답은 한가지가 아닐거에요. 굉장히 다양한 근거를 기반으로한 다양한 답변들이 장기간 작용해서 조금 바뀌는걸겁니다. 예를 [경제가 중요하다!]라고하면서 국가경제성장율을 이야기하는 경우가 많죠. 국가경제성장율을 분명히 중요한 지표입니다. 하지만 우리가 경제라는 이 복잡한 문제를 그 지표 하나로 이해하지는 않죠. 경제성장율을 무엇을 기준으로 어떻게 계산해야하는지 문제, 그와 관련해서 부의분배, 중산층의 비율, 사회적 안전망 + a,b,c,d,e,f... 이런게 다 그 중요한 경제를 이해하는데 영향을 끼쳐야하자나요. 거기에 [아니야 경제보다 중요한건 이거야!]라는 의견도있을수있고요. 개인적으로는 학계도 일반적 담화도 이런 방향으로 흐르게되지 않을까 싶습니다. 지금까지는 빅픽쳐를 표현할 "갓지표"의 개발과 사용이 주를 이루었다고봅니다. 그리고 이건 이대로 효용성이있습니다. 갓지표가 빅픽쳐를 65%만 설명한다해도 그것도 없이 이야기를 하는건 근거가 확실치 않으니 신뢰도 0%의 댕댕이 놀이터니까요. 다만 65%에 만족하지 않기에 75%, 85%, 95%까지 끌어올릴려면은 갓지표만으로는 부족하겠죠. 더 세세한 디테일은 더 통제가 힘든 운빨의 영향이 점점 커지고, 그에 맞추어서 더 복잡하고 다양한 답변을 필요로하게 될것같습니다. 그리고 그거 다해도 가끔씩은 그냥 어쩔수없이 운빨이 드릅게 좋든가 나쁘던가 할수도있는거고요. 축구든, 삶이든, 뭐든 이놈의 운빨망겜, 그래도 다 같이 열불내면서 지지고 볶고 참가하는데 하는만큼 해보고 싶다면, 더럽고 어려운 문제니까 어쩔수없이 더럽고 어려운 해답을 찾아야하는게 아닌가...라는 말을 이렇게 길게했네요. 음 쓰고보니 결론이 간단한데요? 에라이 모르겠다 월도하니까 행복합니다. 12
이 게시판에 등록된 다시갑시다님의 최근 게시물
|