연세대 산업공학과에 재학 중이라는 한 분으로부터 '안녕하세요. 야구에 관한 질문이 있어 메일 드립니다'라는 제목으로 메일 도착. 늘 야구에 관해서는 질문을 하는 처지였는데 상황이 바뀌니 약간 묘한 기분. 그래서 먼저 살짝 내용을 공개하면:
다름이 아니라, 이번 수업 시간에
'야구 경기의 승부와 기록의 상관 관계'
에 대해 프로젝트를 진행 중임에 있어 여쭤볼 말씀이 있어 메일 드리게 되었습니다.
야구의 여러 지표, 통계, 기록 중 어느 것이 가장 승부에 영향을 줄 것이냐는 게 주제인데
의외로 야구의 각 지표에 대한 정확한 정의를 찾기가 힘드네요.
혹 관련 사이트 중 추천할만한 곳이 있으면 부탁드리겠습니다.
Win Probability 같은 지표는 아예 처음 접하는 자료여서 신선했어요. :)
그럼 즐거운 주말 되시기를.
먼저 WP에 대한 글을 정독해 주신 분이 계시다는 것에 감사를. 궁극적인 질문은 과연 야구에서 어떤 지표가 승리와 가장 연관이 큰가 하는 점이다. 물론 머니볼을 사랑하는 독자라면 당연히 '출루율'이 떠오를 것이다. 그렇다면 '야구는 투수놀음'이라던 말은 어떻게 설명할 것인가? 한번 실제 자료를 가지고 놀아보자!
기본적으로 야구 경기 목적은 승리다. 승리를 챙기려면 상대팀보다 1점이라도 더 많이 얻으면 된다. 따라서 승리와 가장 연관이 깊은 지표 하나를 고르라면 단연 득실점차다. 혹은 OPS나 GPA 차이 같은 것들도 역시 승률을 설명하는 데 있어 중요한 구실을 담당할 터.
하지만 문제는 지표를 단 하나만 고르라는 것이다. 그래서 이걸 먼저 한번 알아보기로 하자. 공격과 수비 가운데 어느 쪽이 더 승리와 큰 연관성을 보일까? 검증 도구는 r제곱값(또는 r²)을 사용하기로 한다. r²는 0에서 1까지의 값을 갖는데 1과 가까울수록 두 변수 사이의 '설명력'이 높다고 보면 된다.
여기서 유의해야할 점은 똑같은 1점이 1점이 아니라는 것이다. 무슨 얘기냐면 올해처럼 극악의 투고타저 시즌을 보낼 때 1점과 그 반대 상황에서 1점이 갖는 의미는 다르다는 뜻이다. 따라서 리그 평균을 고려해야 한다. 그러니까 경기당 평균 4.5점이 난 시즌에 평균 5.0점을 기록한 팀과 평균 5.5점을 낸 시즌에서 마찬가지 득점력을 선보인 팀을 똑같이 판단할 수는 없다는 얘기다.
먼저 득점과 실점이 각각 리그 평균과 보이는 차이와 승률을 비교해 보도록 하자. 자료는 우리 프로야구 원년부터 2005 시즌까지의 데이터다. 결과는 이렇다.
수비는 투수 역할과 야수 역할로 나뉜다. 전체 실점 가운데 투수가 책임져야 할 영역을 따로 계산하는 메트릭은 이미 차고 넘친다. 이 가운데 가장 계산이 간단한 게 FIP다. FIP는 계산 과정에 이미 리그 평균과 차이를 고려한다. 야수 몫은 리그 평균 DER과 팀 DER이 어느 정도 차이를 보이는지를 알아봤다.
FIP가 더 높은 r²값을 보인다. FIP는 계산법 자체에 이미 홈런, 볼넷 그리고 삼진에 대한 가치 평가가 들어 있다. HR/9, BB/9, SO/9와 방어율(ERA) 사이 회귀식을 세우면 다음과 같다.
• ERA = 2.17 × HR/9 + 0.47 × BB/9 - 0.08 × SO/9 + 1.05
물론 FIP 공식에서 제시하고 있는 가중치와 차이가 나는 건 사실. 그래도 피홈런이 실점에 있어 가장 중요한 역할을 차지하고 있다는 사실은 달라지지 않는다.
이제 결론을 내릴 때다. 공격과 수비 가운데 승부와 더 큰 연관을 갖는 건 수비다. 투수력과 야수 수비를 비교할 땐 투수력 우위, 특히 피홈런을 적게 허용하는 투수가 승리의 비결이다. 승리를 원한다면 피홈런이 적은 투수를 확보하라.
c.f) FIP와 DER에 대하여