2017년 6월 6일자 글입니다.
optapro라는 스포츠 통계회사 사이트에서 자기네들 통계를 홍보하기 위해 블로그에 올리는 글인데 재미있어서 번역했고 pgr에도 올려봅니다.
일단 글을 이해하기 어려울 수 있기에 앞에서 요약부터 해보자면
0. 축구는 야구와 다르게 흐름이 끊기지 않고 계속 이어지기에 단일스탯으로는 어렵다는 말이 있음, 그래서 축구를 흐름별 쪼개기 위한 과정으로 새로운 스탯을 개발해
1. 기존 패스갯수로 측정하는 점유율이 아닌 새로운 형태의 점유 스탯을 옵타가 개발함
2. 점유란 볼소유권을 얻고 이를 헌납하기 과정까지를 하나의 점유로 정의했고 중간에 게임이 중단된 이후에도 아군이 갖고 있다면 점유는 이어진다
3. 점유는 시퀀스들로 이루어진다.
4. 시퀀스는 볼을 받고 태클이나,슈팅, 라인을 벗어나는 순간 등등 게임이 중단되거나 볼을 헌납하기 까지의 과정이다.
5. 하나의 시퀀스에서 볼이 이동한 거리와 시간등을 통해 팀의 플레이속도를 파악할 수 있다.
점유틀(possessions framework) 소개
지난 1년간 축구 분석작업에 있어서 변화가 크게 있었다. 볼을 잡고 헌납하기까지 기간 동안의 시퀀스(볼이 움직이는 순서)를 분석했고, 이를 통해 한번의 볼 소유시간을 통으로 접근하기 시작했다. 그리고 이 방법론은 많은 변화를 가져왔다.
이러한 접근은 *단일 사건분석에서 빼먹는 볼 흐름의 맥락을 파악하는데 도와줬다. 기대값(xg)을 떠올려보자. 과거 슈팅들을 분석하고 어디서 슈팅 위치와 각도등의 특징을 뽑아내고 이를 통해 얼마나 골로 이어졌는지 확률을 측정하는 스탯이었다. 그리고 이를 도움의 종류와 연관 시키는 것은 이제 흔히 보이곤 한다.
*패스,슈팅,태클 등과 같이 파편적인 스탯을 통한 분석법을 말함,
xg모델에 도움을 포함하면서,우리는 좋은 찬스란 어떤 것인지에 대한 논의로 확장되었다. 그리고 이러한 논의 확장은 더 나아가서 드리블이나 기점이 얼마나 골에 기여하는 지도 알 수 있게 되었다. 단일사건분석만으로는 경기흐름을 파악할 수 없기에, 우리는 점유라는 모델을 적용시켰다.
일련의 이벤트를 하나로 묶기
과거 옵타에서는 점유를 새로 재정의했고, 점유를 표현하기 위해 여러 일련의 사건을 하나로 묶어버렸다. 그리고 이 점유라는 틀을 공식화시키면서 선수나 팀단위에서 유용하고 새로운 통계를 도출할 수 있는 모델로 바꿨다. 다른 많은 축구 분석실무자들 또한 유사한 아이디어와 알고리즘을 보여줬다.
Opta가 제시한 점유모델은 2012년 언급했던 디테일과 유사하지만, 그때와 다르게 이번에는 시퀀스(순서)와 점유로 스탯을 새로 조직화했다.
시퀀스란 한 팀이 플레이가 상대 수비적 행위에 의해 끝나거나 혹은 슈팅이나 여타 플레이들로 마무리되기까지의 과정을 표현한 스탯이다.
점유는 하나의 시퀀스 혹은 한팀이 계속 지속적으로 여러 개의 시퀀스가 이어지는 것을 측정하는 스탯이다. 예시를 들어 설명하겠다. a라는 팀이 여러 번의 패스를 하고 마지막 패스를 받은 선수가 슈팅을 했다고 하자. 이 슈팅이 결국 키퍼에 의해 선방되었으나 볼이 나가면서 이게 코너킥으로 이어지게 됐다. 그럴 경우 a라는 팀은 여전히 볼을 소유하고 있게 된다. 그리고 이 코너킥이 상대에게 빼앗기면 여기까지 점유인 것이다. 시퀀스로 따지본다면 슈팅까지가 하나의 시퀀스 그리고 다시 코너킥에서 볼을 빼앗길때까지가 하나의 시퀀스 즉 두개의 시퀀스가 발생한 것이다.
이렇게 정의된 모델은 몇가지 중요하면서 흥미로운 특징을 가지게 된다.
- 어떤 단일사건들은 시퀀스나 점유에 포함되지 않게 된다
- 볼소유하고 있는 시간 하나하나를 따질 필요가 없어진다.
- 시퀀스는 한선수가 볼을 가지고 컨트롤 하는 시점에서 시작한다. 이는 패스들은 포함되지만 패스나 드리블로 이어지지않는 태클이나, 인터셉션은 시퀀스에서 제외된다.
- 전통적인 점유율은 서로가 합쳐서 100%가 되고 서로의 점유율 차이가 클 수 있으나, 이러한 방식의 점유계산법에서는 서로의 점유 개수가 고작 1개차이밖에 나지 않게 된다. 논리적으로 따져보면 이해할 수 있는 것이, 내가 볼 점유를 빼앗겨야 상대는 볼점유를 하게 되기 때문이다.
- 물론 각 팀의 점유 시간이나, 점유하는 동안 발생하는 시퀀스의 개수는 같지않다.
아래의 예시를 통행 시퀀스랑 점유에 대해서 설명하겠다. 아래 시퀀스는 녹색 화살표에 위치한 조엘마팁이 헤더가 화살표방향으로 이어지며 하늘색원으로 가면서 시작되고 이는 박스안 사각형에 위치한 선수가 역시 화살표방향으로 슈팅하면서 마무리된다.
위의 시퀀스는 슈팅하기전 어떤 형태로 어느 방향으로 리버풀이 볼을 움직였는지 보여준다. 우리는 볼 탈취부터 슈팅까지 14.5초가 걸렸다는 것을 알 수 있고, 또한 이 시퀀스가 마무리되는데 126.44미터로 움직였으나, 직선거리로 따지면 55.96미터가 움직였음을 알 수 있다. 슈팅까지 빌드업과정에서 패스를 몇 개나 했는지 역시 확인할 수 있다.
볼점유의 스타일 파악하기
아래 막대그래프를 보면 경기당 몇번의 점유가 나왔는지 알 수 있다. 보통 몇 개의 점유가 나오는지 알 수 있다. 경기당 평균적으로 200개 이하의 점유가 나오고 보통 팀당 90개에서 100개정도의 점유를 한다
아래 그래프에서는 모든 시퀀스에서 시퀀스당 얼마나 움직이는지 보여준다. 아래서 볼 수 있듯이 사실 많은 시퀀스들이 경기장 넓은 범위를 커버하기전에 끊기기 때문에 짧은 편이다. 그리고 볼 이동거리가 길면 길수록 시퀀스 개수는 줄어든다.
다이렉트 스피드
시퀀스를 통해 측정할 수 있는 흥미로운 스탯중 하나가 다이렉트 스피드이다. 다이렉트 스피드는공이 이동한 직선 거리(미터)를 총 시퀀스의 시간으로 나눠서 측정하는 스탯이다.
앞서보인 리버풀의 시퀀스를 통해 설명해보겠다. 앞의 리버풀 시퀀스에서 볼 이동거리는 55.96m였다. 그리고 이를 14.5초로 나누겠다. 그렇게하면 리버풀의 다이렉트 스피드는 3.85m/s가 나온다. 다른 시퀀스들과 비교해보면 상대적으로 매우 빠른 시퀀스였다. 이러한 속도는 점유보다는 시퀀스 단계에서 상대적으로 더 자주 쓰인다. 왜냐하면 *점유에서 중단된 기간은 스피드측정에 방해되기 때문이다.
*앞서 언급한 코너킥을 떠올려보자.
전술차원에서의 적용
이 점유틀(possessions framework)는 분석가나 코치들이 가졌던 많은 의문들의 답을 해줄 수 있다. 단일사건분석에서는 애를 먹던 그 질문들 말이다. 특히 이 방법은 플레이 패턴과 행동들이 연속적으로 어떻게 발생하는지에 대한 질문에 도움된다.
더 세세한 예시를 들어보겠다. 특정 팀의 다이렉트함이 어디서 볼을 땄는지와 볼을 측면으로 플레이하냐 중앙으로 플레이 하냐에 따라 달라지는지 알고싶다고 하자.
이 질문에 답하기 위해서는 먼저 볼의 시작 위치를 알아야하고 또 측면에 대한 개념을 알아야한다. 시퀀스는 보통 첫스타트(우리진형 혹은 상대진형)을 따지는 곳에서부터 시작하니 이부분은 클리어했다. 그 다음은 측면의 범위를 정해야한다. 우리는 시퀀스를 측정할려면 볼이 중앙으로 움직이고 있는지 측면으로 움직이고 있는지 알아야 했고 이를 위해서 아래처럼 각 위치를 정의했다.
*주황색이 측면, 파랑색이 중앙
첼시는 앞서 알 수 있듯이 다이렉트 스피드가 그렇게 눈에 띄는 수치가 아니다. 그러나 볼의 시작위치와 전개의 방향이 측면인지 중앙인지 한정시켜서 따져보면 이야기는 달라진다. 하프라인 기준 자신의 진형에서 볼을 빼앗은 다음 중앙으로 볼을 전개했을 때 첼시는 top3안에 들어가는 볼스피드를 보여준다. (2.47m/s로 나타난다. 이는 평균 다이렉 트스피드가 1.93m/s인 것을 감안하면 높은수치다.)
물론 이 예시는 다소 특이한 케이스이다. 허나 단일사건분석법으로는 알 수 없는 질문에 대해 점유틀은 답을 제공할 수 있다는 점을 잘보여준다