여기는 스포츠가 공용어입니다.


❝스포츠에서 유일한 것이 승리라면 이기는 그 순간 다시 경합을 벌여야겠다는 욕구는 사라질 것이다. 그렇다면 마이클 조던과 로저 클레멘스가 나이 마흔에 계속 경쟁을 벌였던 사실을 어떻게 이해할 것인가.❞

─ '소크라테스 야구장에 가다' 中에서

연세대 산업공학과에 재학 중이라는 한 분으로부터 '안녕하세요. 야구에 관한 질문이 있어 메일 드립니다'라는 제목으로 메일 도착. 늘 야구에 관해서는 질문을 하는 처지였는데 상황이 바뀌니 약간 묘한 기분. 그래서 먼저 살짝 내용을 공개하면:

안녕하세요, 연세대학교 산업공학과에 재학 중인 장기백이라고 합니다.
 
다름이 아니라, 이번 수업 시간에
'야구 경기의 승부와 기록의 상관 관계'
에 대해 프로젝트를 진행 중임에 있어 여쭤볼 말씀이 있어 메일 드리게 되었습니다.
 
야구의 여러 지표, 통계, 기록 중 어느 것이 가장 승부에 영향을 줄 것이냐는 게 주제인데
의외로 야구의 각 지표에 대한 정확한 정의를 찾기가 힘드네요.
 
혹 관련 사이트 중 추천할만한 곳이 있으면 부탁드리겠습니다.
Win Probability 같은 지표는 아예 처음 접하는 자료여서 신선했어요. :)
 
그럼 즐거운 주말 되시기를.

먼저 WP에 대한 글을 정독해 주신 분이 계시다는 것에 감사를. 궁극적인 질문은 과연 야구에서 어떤 지표가 승리와 가장 연관이 큰가 하는 점이다. 물론 머니볼을 사랑하는 독자라면 당연히 '출루율'이 떠오를 것이다. 그렇다면 '야구는 투수놀음'이라던 말은 어떻게 설명할 것인가? 한번 실제 자료를 가지고 놀아보자!

기본적으로 야구 경기 목적은 승리다. 승리를 챙기려면 상대팀보다 1점이라도 더 많이 얻으면 된다. 따라서 승리와 가장 연관이 깊은 지표 하나를 고르라면 단연 득실점차다. 혹은 OPS나 GPA 차이 같은 것들도 역시 승률을 설명하는 데 있어 중요한 구실을 담당할 터.

하지만 문제는 지표를 단 하나만 고르라는 것이다. 그래서 이걸 먼저 한번 알아보기로 하자. 공격과 수비 가운데 어느 쪽이 더 승리와 큰 연관성을 보일까? 검증 도구는 r제곱값(또는 r²)을 사용하기로 한다. r²는 0에서 1까지의 값을 갖는데 1과 가까울수록 두 변수 사이의 '설명력'이 높다고 보면 된다.

여기서 유의해야할 점은 똑같은 1점이 1점이 아니라는 것이다. 무슨 얘기냐면 올해처럼 극악의 투고타저 시즌을 보낼 때 1점과 그 반대 상황에서 1점이 갖는 의미는 다르다는 뜻이다. 따라서 리그 평균을 고려해야 한다. 그러니까 경기당 평균 4.5점이 난 시즌에 평균 5.0점을 기록한 팀과 평균 5.5점을 낸 시즌에서 마찬가지 득점력을 선보인 팀을 똑같이 판단할 수는 없다는 얘기다.

먼저 득점과 실점이 각각 리그 평균과 보이는 차이와 승률을 비교해 보도록 하자. 자료는 우리 프로야구 원년부터 2005 시즌까지의 데이터다. 결과는 이렇다.

 


여기서 우리는 한 가지 결론에 도달할 수 있다. 공격보다는 수비가 승률을 설명하는 능력이 더 뛰어나다는 것. 달리 말해 상대팀에게 점수를 적게 주는 야구가 더 승리할 가능성이 높다는 뜻이다. 그럼 어떤 수비 지표가 실점 억제에 있어 가장 영향력이 큰 지 밝혀내면 게임 오버.

수비는 투수 역할과 야수 역할로 나뉜다. 전체 실점 가운데 투수가 책임져야 할 영역을 따로 계산하는 메트릭은 이미 차고 넘친다. 이 가운데 가장 계산이 간단한 게 FIP다. FIP는 계산 과정에 이미 리그 평균과 차이를 고려한다. 야수 몫은 리그 평균 DER과 팀 DER이 어느 정도 차이를 보이는지를 알아봤다.


FIP가 더 높은 r²값을 보인다. FIP는 계산법 자체에 이미 홈런, 볼넷 그리고 삼진에 대한 가치 평가가 들어 있다. HR/9, BB/9, SO/9와 방어율(ERA) 사이 회귀식을 세우면 다음과 같다.

• ERA = 2.17 × HR/9 + 0.47 × BB/9 - 0.08 × SO/9 + 1.05


물론 FIP 공식에서 제시하고 있는 가중치와 차이가 나는 건 사실. 그래도 피홈런이 실점에 있어 가장 중요한 역할을 차지하고 있다는 사실은 달라지지 않는다.

이제 결론을 내릴 때다. 공격과 수비 가운데 승부와 더 큰 연관을 갖는 건 수비다. 투수력과 야수 수비를 비교할 땐 투수력 우위, 특히 피홈런을 적게 허용하는 투수가 승리의 비결이다. 승리를 원한다면 피홈런이 적은 투수를 확보하라.


c.f) FIP와 DER에 대하여

  • FIP는 Fielding Independent Pitching 약자로 전체 실점 가운데 투수가 책임져야 할 점수를 보여주는 메트릭이다. 보로스 맥라켄이 주장한 DIPS(Defense Independent Pitching Stat.)의 수학적 원리만을 뽑아 Tango Tiger로 알려진 세이버메트리션이 창안해 냈다. 공식은 FIP = ( 13 × 홈런 + 3 × 사사구 - 2 × 삼진 ) ÷ 이닝 + 보정용 상수
  • DER은 Defense Efficiency Ratio 약자로 인플레이된 타구(Balls In Play) 가운데 몇 %를 아웃으로 처리했는지 보여준다. 예를 들어 상대 타자가 공 10개를 때려 그라운드 안에 공이 머물고 있을 때 이 가운데 3개만 안타로 연결됐다면 나머지 타구 7개, 즉 70%를 아웃으로 처리한 것이다. 이 경우 DER은 .700이다. 공식은 DER = ( 상대 타자 - 안타 - 삼진 - 사사구 - 에러로 인한 출루 허용) ÷ ( 상대 타자 -홈런 -삼진 -사사구 )



  • 댓글,

    더 보기