원 출처:
https://theathletic.com/1692489/2020/03/23/the-10-commandments-of-football-analytics/
번역 출처:
https://serieamania.com/g2/bbs/board.php?bo_table=calciotalk&wr_id=2334121 세리에매니아 Kuri Takeshi
작년, '디 애슬레틱'의 벤 볼드윈은 '미식축구 분석의 10계명'이라는 칼럼을 작성했다. 이렇게 공을 다루는 스포츠에 숫자를 이용한 데이터들이 많이 사용되고 있지만 그러한 것이 항상 정확한 것은 아니다. 이번 칼럼을 통해서 사람들이 팀과 선수들을 분석할 때에 어떠한 점에 중점을 두어야 하는지에 대해서 알아보고자 한다.
1) 골키퍼의 대인 방어 능력을 평가하기 위해서 선방률을 사용해서는 안 된다.
예시: "마르틴 두브라브카는 73.9%의 선방률을 보여주는 프리미어 리그에서 8번째로 우수한 골키퍼다."
왜 이것이 잘못되었는가: 선방률이라는 개념은 선방 횟수/총 슈팅 수로 이루어진다. 그런데 여기에는 골키퍼가 어떠한 슈팅을 막았는지에 대한 설명은 포함되지 않는다. 여기에 골키퍼 X와 Y가 있다. 둘 다 10개의 슈팅을 막아냈다고 해보자. 하지만 차이가 있다. Y는 30야드 밖에서 때린 슈팅 10개를 막아냈지만 X는 페널티 박스 안에서 나온 슈팅 10개를 막아냈다.
'기대 골 수치(xG)'와 그의 사촌 격인 '유효슈팅 대비 기대 골 수치(xGT)'는 먼 거리에서 때린 슈팅이 득점으로 이어지기가 더 어렵다는 것을 보여준다. 어느 정도 축구에 대해서 아는 사람이라면 이것과 똑같은 말을 할 것이다. 결국 우리는 이러한 데이터에서 모든 슈팅에 같은 가중치를 부여함으로써 X를 과소평가하고 Y를 과대평가 하고 있다.
어떻게 사용해야 하는가: 골키퍼의 실점에 '유효 슈팅 대비 기대 골 수치(xGT)'를 이용하면 슈팅의 질의 비교가 가능해진다. 여기서 'Goals Prevented'라는 데이터는 실제로 골키퍼가 직면한 슈팅의 질을 평가하고 일반적인 평균 골키퍼 대비 얼마나 좋은 모습을 보였는지 수치를 보여준다. 이 수치를 대입해보면 마르틴 두브라브카는 프리미어 리그에서 2위를 기록하고 있고 빈센테 과이타가 최고의 모습을 보여주고 있다.
'빈센트 과이타는 뛰어난 선방을 보여주고 있다'
2) 선수의 활동량을 나타내기 위해 뛴 거리나, 스프린트 기록을 사용해서는 안 된다
예시: "메수트 외질은 요즈음 아스날의 어떠한 선수보다 많이 뛰며 11.12km라는 활동량을 보여준다."
왜 이것이 잘못되었는가: 프리미어 리그 클럽들은 13-14시즌부터 트래킹 데이터를 사용하고 있다. 이러한 것의 일부분으로 언론들도 이러한 데이터에 접근이 가능하다. 지금까지 우리는 뛴 거리와 스프린트에 대한 데이터를 많이 봐왔다. 그런데 실제로 이러한 숫자들의 대부분은 맥락과 관련이 없다. 이 수치를 이용하지 않는 이유는 많다.
우선, 달리는 거리와 승리 가능성 사이에는 어떠한 상관관계도 존재하지 않는다. 이런 거리 개념은 일정한 거리를 개별적으로 달려 걸린 시간으로 승부를 겨루는 '타임 트라이얼'에나 유효하지 축구는 그렇지 않다. 작년 챔피언스 리그에 대한 UEFA의 테크니컬 보고서에 따르면 샤흐타르 도네츠크는 32개 팀 중에 가장 높은 수치를 기록했지만 조별 예선에서 3위를 기록해 유로파 리그로 떨어지고 말았다. 반면 맨체스터 유나이티드는 뒤에서 2등이었지만 8강까지 올라갔다. 이처럼 뛴 거리는 그렇게 많은 것을 말해주는 수치가 아니다.
두 번째로 뛴 거리와 스프린트는 다소 추상적인 개념이다. 왜냐하면 선수들이 감독에게 요구받은 사항, 팀의 전술, 상대 팀의 전술, 경기의 양상 등등 다양한 요소에 영향을 받기 때문이다. 이러한 요소들에 대한 조정 혹은 최소한의 언급 없이 이러한 수치를 사용하는 것은 그렇게 도움이 되지 않는다.
마지막으로 적게 뛰는 것이 더 효율적이라는 사례도 존재하고 리오넬 메시만 보더라도 그렇다. 대부분의 선수들은 한 경기를 다 치를정도의 체력은 지니고 있다. 중요한 것은 공간을 어떻게 활용하느냐다. 이처럼 빠르게 뛰는 선수들은 많지만 그중에서도 이러한 속도를 '언제' 활용해야 하는지 아는 선수는 드물다. 다른 선수를 달리기로 이기는 것이 아니라 순간 스피드로 선수를 따돌리거나 순간적으로 볼을 건드리는 것이 중요하다.
이러한 데이터는 가치가 있긴 하지만 선수가 경기에 뛰기에 적절한 컨디션인지를 평가하는 선수 관리 측면에 더 어울린다고 볼 수 있다. 축구는 공간과 시간을 사용하는 스포츠다. 현재 시점에선 이러한 요소들이 흥미롭게 다가오기엔 부족한 측면이 있다.
어떻게 사용해야 하는가: 아쉽게도 이것에 대한 훌륭한 대안은 없다. 이러한 데이터를 사용하기 전에 확실하게 고려해야 할 부분을 표기해놓는 것이 아니라면 사용하지 않는 것이 나을듯하다.
3) 팀의 퀄리티를 평가하는 데에 점유율을 사용해서는 안 된다.
예시: "토트넘은 뉴캐슬에게 0-1로 패배했지만 점유율은 79.8%에 이르렀다. 03-04 시즌 이후 프리미어 리그에서 패배한 팀의 점유율에서 두 번째로 높은 수치다."
왜 이것이 잘못되었는가: 마티 페라르나우는 '펩 컨피덴셜'이라는 책에서 다음과 같이 설명해두었다, "점유율은 목적을 이루기 위한 수단이다. 도구일 뿐이며 목적이나 최종 목표가 아니다." 레스터 시티가 15-16시즌 우승을 거둘 때 평균 점유율은 42.6%에 불과했다. 맨체스터 시티의 경우 지난 시즌 우승을 거두었을 때 평균 점유율은 67.7%였다. 사실 점유율이 얼마인지는 중요하지 않다. 그 점유율을 바탕으로 뭘 했느냐가 중요한 것이다.
점유율 싸움에서 승리했다는 것은 그 팀이 경기를 위해 전술적으로 얼마나 준비했는지 이상을 말해주진 않는다. 실제로 최종 스코어에 의해 이러한 것은 달라질 수 있다. 아틀레티코 마드리드는 챔피언스 리그 16강 1차전에서 리버풀을 상대로 1-0 승리를 거두었다. 전반 4분에 득점을 한 이후에 아틀레티코의 점유율은 27%에 불과했다. 만약 아틀레티코가 이른 시간에 득점하지 못했다면 이런 수치는 완전히 다르게 보일 수도 있었다.
어떻게 사용해야 하는가: 점유율은 여전히 어느 팀이 공을 더 많이 가지고 있었는지를 알 수 있는 중요한 정보다. 하지만 어떤 팀이 다른 팀 보다 낫다는 주장을 하기 위해서 사용하는 것은 안된다. '기대 골 수치(xG)'가 팀의 퀄리티를 훨씬 더 보여주는 수치다. 만약 이러한 퀄리티에 대해서 논하고 싶다면 이 수치를 통해 당신의 팀이 얼마나 많은 기회를 만들고 막아냈는지를 보라.
4) 태클과 가로채기 수치를 통해 선수의 수비력을 판단해서는 안 된다.
예시: "히카르두 페레이라는 이번 시즌 119번의 태클을 성공시킨 프리미어 리그 최고의 수비수다."
왜 이것이 잘못되었는가: 선수의 수비가 다 보이는 것은 아니며 팀의 스타일에 따라 다르게 나타날 수 있는 부분이다. 논리적으로 만약 해당 팀의 점유율이 낮다면 수비의 기회가 많아지는 것이고 반대도 마찬가지다.
이러한 이유 때문에 태클과 가로채기 숫자는 수비 스타일(수동적인지 혹은 능동적인지)을 나타내기에 적합하고 수비 실력을 판단하는 것엔 필요치 않다. 반 다이크는 90분에 평균 태클이 0.76개에 불과한 선수다. 하지만 누구도 그를 수비 못하는 선수라고 평가하지는 않는다. 또한 선수가 속해있는 팀의 스타일이나 점유율과 연관성이 높기 때문에 한 선수를 다른 선수와 비교하는 것은 어렵다.
어떻게 사용해야 하는가: 이러한 것을 막기 위해서 우리는 상대가 1,000번 터치를 할 때마다 선수가 하는 행동을 수치화해서 수비적 수치를 조정하는 것이 가능하다. 이는 모든 선수들을 공평하게 비교할 수 있는 방법이다. 조던 헨더슨은 90분 평균 태클이 2.6회로 프리미어 리그 15위에 해당하는 선수다. 하지만 이렇게 다른 수치들을 고려해서 종합하면 상대가 1,000번 터치할 때 헨더슨의 태클 횟수는 4.6회로 나타난다. 이는 그가 리그에서 다섯 번째로 능동적인 수비형 미드필더라는 것을 보여준다.
이렇게 조정된 수치는 수비의 스타일에 대해 조금 더 공평한 결과를 보여준다. 그러나 이것도 스타일을 보여줄 뿐이지 전체적인 수비력에 대해서 나타내지는 못한다.
5) 선수의 태클 능력을 평가하기 위해서 태클 성공률을 사용해서는 안 된다.
왜 이것이 잘못되었는가: 하나의 비밀을 알려주겠다. 태클 실패와 태클 성공은 사실상 같은 것이다. 만약 태클에 관해서 다른 수치가 나온다면 무시해도 좋다.
태클은 2가지로 나뉜다. 하나는 태클 성공이고 하나는 태클 실패다. 태클에 성공했다는 것은 공을 탈취해 볼 점유를 되찾았다는 것이다. 하지만 태클 실패는 공을 따내기 위해 태클을 했지만 공을 가져오지 못했다는 의미다. 태클 실패는 태클을 했는데 공이 나가서 상대에게 스로인이 주어졌거나, 상대방에 공을 다시 딸 수 있게 공이 흘렀거나 혹은 다른 이유들로 인해 발생한다.
태클 성공률은 현재 태클 성공횟수 / (태클 성공횟수 + 태클 실패횟수)로 정의된다. 이렇게 현재 태클은 선수가 팀이 공을 되찾게 얼마나 기여했는지에 대한 비율로 따지고 있다.
그렇다면 무엇이 문제인가? 우선 이러한 수치는 선수의 태클을 해서 공을 가지고 있던 선수가 튕겨져 나가는 때와 태클로 인해 파울이 일어나는 것들을 배제하고 있기 때문이다. 높은 태클 성공률을 가지고 있는 프리미어 리그 풀백들 중에서 마틴 켈리는 80%로 1위를 기록하고 있다. 이러한 수치는 완-비사카가 높은 순위를 기록해야 한다고 하지만 그는 11위에 불과하다. 어떻게 된 것일까?
어떻게 사용해야 하는가: 진짜 태클 성공률은 이렇게 놓치는 2개의 카테고리에 대한 실수를 피할 수 있다. 공식은 다음과 같다: 총 태클 횟수/(총 태클 횟수 + 볼을 따내지 못한 횟수 + 태클로 인해 파울이 일어난 횟수). 이런 공식으로 따져보면 완-비사카는 78.9%로 프리미어 리그에서 1위로 올라가고 마틴 켈리는 29위로 떨어지게 된다.
'파울과 볼을 따내지 못한 것까지 다 고려한다면 완-비사카가 리그 내에서 최고의 1:1 태클러다.'
6) 작은 샘플 속에서 마무리 능력을 나타내기 위해 골에서 기대 골 수치를 빼서는 안 된다.
예시: "호베르투 피르미누는 12.7 xG에서 8골 밖에 성공시키지 못했으니 그는 결정력이 좋지 않은 선수다."
왜 이것이 잘못되었는가: 득점 능력에 대해서 이해하려면 두 가지의 중요한 요소를 따로 분리해서 생각해야만 한다. 첫 번째는 찬스를 스스로 창출하는 능력이다. 득점은 공격수의 평가의 중요한 부분이고 득점을 위해 공격수는 슈팅을 해야만 한다. 이러한 슈팅의 질을 평가하기 위해서는 기대 골 수치(xG)를 사용한다. 만약 선수가 계속해서 득점에 좋은 위치를 차지하고 있다면 이러한 수치는 계속해서 올라간다.
득점의 첫 요소가 슈팅을 하는 것이라면 두 번째는 마무리를 하는 것이다. 한 시즌과 같이 작은 샘플 속에서 선수의 득점과 xG는 일치하지 않을 수도 있다. 호베르투 피르미누의 경우를 살펴보자. 이번 시즌의 경우, 피르미누는 찬스에서 기대했던 것과 달리 저조한 득점력을 보였다. 하지만 그는 최고의 득점 기회를 잡는 데에 있어서는 최고였다.
'피르미누의 득점과 기대 골 수치가 최근 시즌동안 어떻게 달라졌는가'
3시즌 동안의 피르미누의 득점과 기대 골 수치를 살펴봤을 때 수치는 올라갔다 내려갔다 하는 모습을 보인다. 그의 마무리 능력에 대해 결론을 내리기엔 충분하지 않은 데이터다.
어떻게 사용해야 하는가: 기대 골 수치(선수가 얻은 기회)와 유효슈팅 대비 기대 골 수치(선수가 기회에서 무엇을 했는가)를 비교하는 것이 선수의 마무리 능력을 평가하는 데에 있어서 가장 기본적인 방법으로 고려해볼 만하다. 이보다 큰 샘플이 있다고 하더라도 사용에는 주의를 기해야 하며 수백 번 이상의 슈팅 샘플이 있어야만 한다.
축구 데이터계에서는 마무리가 반복될 수 있는 능력인지에 대한 논의가 계속해서 이어지고 있다. 적절한 정답이 나올 때까지는 기대 골 수치에 따라 득점한다는 데이터에 의존해야만 한다.
7) 선수의 유무로 팀의 퍼포먼스를 판단해서는 안 된다.
예시: "아스날은 이번 시즌 메수츠 외질이 없는 경기에서 40%의 승률을 기록하고 있다. 그가 있을 때의 승률인 28%에 비하면 높은 수치다."
왜 이것이 잘못되었는가: WOWY(With or without you)라는 개념은 한 선수의 영향력을 알아보기 위해서 선수가 없을 때의 성적과 비교하는 개념이다. 하지만 이는 더 작은 선수들이 뛰고 선수의 교체가 잦으며 득점수가 많은 농구와 같은 스포츠에 이용되는 통계다. 하지만 축구에서 사용하려면 고려해야 할 요소들이 너무 많다. 외질의 통제 하에 있는 부분이 아닌데도 평가 절하 당하는 부분이 존재한다.
WOWY에서는 다음과 같은 것들이 고려되지 않는다: 상대의 실력은 어땠는가? 외질과 함께 하는 선수들의 실력은 어땠는가? 레드카드가 나왔었나? 외질은 교체로 들어갔나?
동일하게 번리에 적용해도 문제가 발생한다. 벤 미와 제임스 타코우스키는 프리미어 리그에서 똑같은 시간을 뛰었다. 어떤 선수가 더 나은 선수인가? 아마 이렇게는 절대 알아낼 수 없을 거다.
어떻게 사용해야 하는가: 선수의 포지션을 토대로 분석하는 것이 나을 것이고 그들이 통제할 수 있는 부분이 어떤 것인지에도 집중해야한다. 외질과 같은 창조적인 미드필더들에게는 기회 창출을 봐야 하고 공격수들은 득점을 봐야 할 것이다. WOWY와 같은 통계는 실내 스포츠에서 사용하도록 두자.
8) 패스 정확도로 선수의 패스 능력을 평가해서는 안 된다.
예: "필립 바슬리는 63.3%의 패스 성공률을 기록한 패스에 있어서 프리미어 리그 최악의 풀백이다."
왜 이것이 잘못되었는가: 선수의 패스 정확도는 선수가 공을 가지고 있을 때 어떠한 선택을 하라고 요구받았는지에 달려있다. 맨체스터 시티와 같은 팀들은 매우 짧은 패스를 요구한다. 이러한 성향 때문에 높은 패스 성공률을 가지게 된다. 반면 번리와 같은 팀들은 짧은 패스보다 긴 패스를 때려 넣는 것을 선호하기 때문에 패스 성공률이 낮게 나타날 수밖에 없다.
패스에 대한 데이터가 모든 것을 알려주지는 않는다. 밑에 있는 최근 리즈 유나이티드의 경기 그림을 통해 살펴보자.
'엘데르 코스타의 패스는 수비수의 커버로 코너킥이 되고 부정확한 패스로 기록이 된다.'
영상에서 나오는 엘데르 코스타의 패스는 헐 시티 수비수의 빠른 커버로 실패한 패스로 기록된다. 여기서 우리는 볼 소유의 유지와 코스타가 해낸 전진에 대해 고려해야만 한다. 볼 소유는 유지가 되었는데 패스는 부정확하듯이 이러한 상황이 다르게 발생하는 경우도 있다. 결국 선수들은 불공평하게 평가를 받는 것이다.
어떻게 사용해야 하는가: 이에 대해서 나중에 따로 글을 또 쓸 것이다. 왜냐하면 현재로서는 이 문제를 해결할 수 있는 적절한 측정 항목이 많다고 생각하지 않기 때문이다. 기대 패스 성공률과 같은 수치가 선수들의 패스 성공률이 왜 이렇게 낮은지에 대해서 어느 정도 설명할 수 있다고 보지만 이러한 통계는 상대적으로 대중들에게 잘 알려지지 않은 개념이다.
9) 선수가 실패를 많이 하더라도 이것을 평가해서는 안 된다.
예: "알렉산더-아놀드는 프리미어 리그의 어떤 선수들 보다 부정확한 패스를 많이 한다."
왜 이것이 잘못되었는가: 디 애슬레틱의 마이클 콕스는 이에 관한 칼럼(시도를 많이, 많이 해야 한다는 것)을 쓰기도 했다. 그렇기 때문에 나는 이에 대해서 깊게 파고들지는 않을 것이다. 매 시즌 골든 부츠의 위너는 그들이 득점에 성공한 것 이상의 찬스를 놓친다. 만약 우리가 정말로 간결한 피니셔를 찾기 원한다면 전환율을 살펴봐야 하는데 그러려면 결국 득점이 필요하다.
어떻게 사용해야 하는가: 대부분 선수가 얼마큼 놓쳤는지에 대해서만 집중을 한다. 상황에 맞게 사용하기 위해서는 이를 백분율로 전환하는 것이 더 적합하다. 결국 이렇게 생각해봐야 한다. 그들이 더 많이 놓친 것인지, 아니면 다른 선수들에 비해서 더 많이 뭔가를 해내려고 했던 것인지를 말이다.
10) 출전 시간이 다른 선수를 비교해서는 안 된다.
예: "알렉산더-아놀드와 제임스 매디슨은 리그에서 두 번째로 많은 기회(75회)를 만들어낸 선수들이다."
왜 이것이 잘못되었는가: 더 많은 시간을 뛴 선수는 그렇지 않은 선수들 보다 무언가를 만들어낼 기회가 많다. 출장 시간별로 선수를 나열하지 않는다면, 덜 출장한 선수는 항상 최악의 선수로 보일 것이다. 노리치의 에미 부엔디아에 다루면서 나의 이름을 조금 알린 것도 사실이지만 90분 당 찬스 메이킹으로 나열해보면 실제로 부엔디아는 2위를 기록하고 있다.
'출전 시간 대비로 나열해보면 부엔디아, 마레즈, 그로스가 높은 순위로 올라온다.'
어떻게 사용해야 하는가: 90분 당 찬스 메이킹으로 스탯을 조정(전체 출전 시간을 90으로 나누는 스탯과는 다른 개념이다) 하면 출장 시간이 다르다고 하더라도 비교가 가능해지고 더 공평한 비교가 가능하다.
사실 이 칼럼에 나온 이야기들도 극히 일부분의 이야기에 불과합니다. 통계는 거짓말을 하지 않지만, 그러한 통계에 영향을 주는 요소들은 너무나도 많고 우리는 그것들의 많은 부분을 간과한 채 통계를 해석하는 경우가 많죠. 이것은 비단 축구에만 적용되는 이야기가 아닐 겁니다. 농구, 그리고 야구도 사실 마찬가지입니다. 스탯지에는 숫자가 표시될 뿐이지만 하나의 행동이 어떠한 상황, 어떠한 맥락에서 일어났는지를 파악하지 않고 받아들인다면 그것은 죽은 숫자나 다름없을 것이겠죠.