여기는 스포츠가 공용어입니다.


❝스포츠에서 유일한 것이 승리라면 이기는 그 순간 다시 경합을 벌여야겠다는 욕구는 사라질 것이다. 그렇다면 마이클 조던과 로저 클레멘스가 나이 마흔에 계속 경쟁을 벌였던 사실을 어떻게 이해할 것인가.❞

─ '소크라테스 야구장에 가다' 中에서

홈런왕은 리그 홈런 1위에게 돌아간다. 타점왕도 마찬가지다. 그럼 타격왕은? 혹은 수위타자는? 모두 타율 1위에 오른 타자를 지칭하는 표현이다. 그러니까 가장 높은 타율을 선보인 타자야 말로 '타격의 왕'이며 모든 타자 가운데 '수위(首位)'라는 인식이 분명 자리 잡고 있는 것이다. 그래서 우리는 몇 년 연속 3할 타자를 칭송하고, 백인천 전 감독이 국내 야구에서 유일한 4할 타자라는 점을 기억한다. 하지만 정말 타율 1위는 타격왕 또는 수위타자라 불릴 만한 자격이 있는 걸까?


타자가 타석에 들어서는 까닭은 오직 한 가지다. 바로 득점이다. 따라서 어떤 타자가 타격왕 또는 수위타자라 불려야 하는지 해답은 이미 나온 것이나 다름없다. 가장 많은 득점에 기여한 타자에게 '타격왕'이라는 호칭을 부여하면 되는 것이다. 그런데 이 호칭은 이미 타율 1위가 받기로 돼 있다. 따라서 우리는 한 가지 사실만 더 확인하면 이 호칭의 적합성 여부를 알아볼 수 있다. 타율이 높을수록 많은 득점을 얻을 수 있다면 기꺼이 그를 '타격왕'이라 부르면 되는 것이다.


한번 통계적인 검증을 통해 타율과 득점 사이엔 어떤 상관관계가 있는지 알아보자. 우리가 검증에 사용하고자 하는 도구는 R제곱값(R-Square, R²)이다. R²는 0~1 사이의 값을 갖는 수치로, 두 변수의 변화를 서로 얼마나 '설명할' 수 있는지를 나타내준다. 이를 테면 이렇다. y=x 그래프가 있다고 치자. 그럼 x, y 두 값은 언제나 서로 완벽한 비례 관계를 이룰 것이다. 이 경우의 R²값은 1이다. x값이 변함에 따라 y값이 어떻게 변하는지 100%(=1) 설명할 수 있기 때문이다. 이처럼 R²는 1에 가까울수록 높은 설명력을 보이게 된다. 거꾸로 0에 수렴할 경우 두 변수 사이의 상관관계는 무의미하다고 봐도 좋다. 다음은 프로 원년인 '82시즌부터 지난 시즌까지 25년간 각 팀의 타율과 경기당 평균 득점간의 R²값을 알아본 그래프이다.


R²값이 .7328이다. 다시 말해 타율 변화로 득점력 증가를 73.28% 설명할 수 있다는 것이다. R²값이 .70이 넘어가면 상당히 높은 설명력이다. 따라서 이 명제는 꽤 수긍할 만한 결과라 할 수 있다. 그리고 만약 타율보다 높은 R²값을 보이는 타격 기록이 없다면, 타율 1위 선수를 '타격왕'이라 부르는 게 옳을 것이다. 하지만 결론부터 이야기하자면 타율은 득점력을 설명하는 정도가 그리 대단치 못하다. 그래서 타율에 허상이 있다고 주장하는 것이다. 실제 데이터를 통해 봐도, 주요 비율 스탯인 타율, 출루율, 장타율 가운데 득점력과 가장 낮은 상관 관계를 보이는 것이 바로 타율이다. 


아래 그래프를 보면 출루율은 .7920, 장타율은 .8471의 R²값을 갖는다는 사실을 확인할 수 있다.



그럼 무엇 때문에 이 두 값이 타율보다 높은 R² 값을 보이는 것일까? 이유는 간단하다. 득점이란 기회와 그 기회를 살리는 능력을 통해 이뤄지는 것이기 때문이다. 여기서 전자에 해당하는 것이 바로 출루고 후자에 해당하는 것이 장타다. 안타든 볼넷이든 타자가 루상에 출루하지 않고서는 기회를 잡기가 어렵다. 또한 단타보다는 2루타가, 2루타보다는 홈런이 주자를 홈으로 불러들이기가 더 수월하다. 물론 장타를 때린 타자가 또 다른 기회를 이어 나갈 수 있음은 두말할 필요가 없는 사실이다.


하지만 타율은 이런 차이를 전혀 보여주지 못한다. 볼넷은 계산에 반영되지 않을뿐더러 장타의 가치도 전혀 고려되지 않고 있기 때문이다. 따라서 타자의 능력을 측정하기 위해서는 장타율과 출루율이 중심이 되어야 한다. 이를 기본 원리로 만들어진 몇 가지 지표 가운데 가장 유명한 건 OPS(On base percentage Plus Slugging percentage)다. 단순히 장타율과 출루율을 더한 값이지만, 득점의 기본 원리를 충실하게 따랐다는 게 가장 큰 장점이다.


OPS는 국내 리그에서도 뛰어난 설명력을 보인다. R²이 무려 .9033에 달한다. 타율은 물론 그 어떤 값보다도 높은 설명력이다. 하지만 OPS는 결정적인 약점을 안고 있다. 기본적으로 출루율과 장타율은 1:1로 비교될 수 있는 성질의 값이 아니다. 많은 세이버메트리션들은 출루율이 장타율보다 더 중요하다는 사실을 밝혀낸 바 있다. 따라서 출루율과 장타율을 직접 더하면 장타율이 과대평가될 수밖에 없다. 그런데도 OPS에서는 이 둘을 동일하게 평가한다. 정확한 측정을 위해서는 출루율에 높은 가중치를 주어야 할 필요가 있는 것이다. 이것이 바로 GPA(Gross Production Average)의 시발점이 됐다.


GPA는 Aaron Gleeman이라는 젊은 세이버메트리션이 Tango Tiger로 더 잘 알려진 Tom Tango의 연구 결과를 토대로 만든 메트릭이다. Tango는 자신의 블로그에서 1.7~2.0 정도의 가중치를 출루율에 부여할 때 득점력을 좀더 정확하게 설명할 수 있다고 주장했다. Gleeman은 여기서 착안해 출루율에 1.8의 가중치를 줬다. 그리고는 계산된 값을 4로 나눴다. 타율과 유사한 범위의 값을 갖게 함으로써 야구팬들이 직관적으로 받아들일 수 있게끔 하기 위해서였다.


GPA와 실제 득점간의 R²는 .9075다. OPS보다 조금 낫기는 하지만 무시할 정도의 차이다. 하지만 그 값을 받아들이는 과정에 있어서는 분명 차이가 난다. 지금껏 가장 높은 팀 OPS를 기록한 팀은 '00년 현대다. 값으로는 .848, 보통의 야구팬이라면 어느 정도 수준인지 가늠하기 어려운 수치다. 반면 가장 낮은 GPA를 기록한 팀은 '93 시즌의 태평양으로 .205의 GPA를 기록했다. 타율이 .205라고 생각하면 그 팀이 얼마나 빈약한 공격력의 팀이었는지 손쉽게 알 수 있다. 그것이 GPA의 가장 큰 장점이다. 타율의 범위에 익숙한 야구팬들에게 GPA 수치는 한번에 느낌이 오는 것이다.


이처럼 GPA는 손쉬운 계산이라는 OPS의 장점을 살리면서도, 출루율에 대한 가중치로 장타율이 과대평가되는 성질을 막는다. 게다가 직관적인 범위의 값까지 보여주는 썩 괜찮은 메트릭이다. 적어도 타율보다는 확실히 괜찮다. 그래서 이제 한번 3할 타자를 부를 때 타율 대신 GPA를 한번 써보는 건 어떨까? 그가 실제로 득점에 기여한 바가 더 크다고 봐도 무리는 아닐 테니 말이다. 그리고 '타격왕' 자리 역시 타율 1위가 아닌 GPA 1위에게 돌아가는 편이 훨씬 진실에 가까울 것이다. 타자의 역할이 결국 득점 창출이라는 사실은 달라지지 않을 테니까 말이다. 그리고 GPA야 말로 타자가 득점에 공헌한 바를 가장 잘 보여주는 메트릭이니까 말이다.





댓글,

더 보기