Во время учебы в колледже я также начал читать ежегодник «Baseball Prospectus», основанный в 1996 г. Гэри Хакебеем. Этот рыжий человек с неимоверными запасами энергии и сарказма пригласил на работу команду авторов новостной группы newsgroup rec.sport.baseball (бывшей в первые годы интернета авангардом статистического анализа спорта). Хакебей почуял возможность, которую предоставлял в то время рынок: Билл Джеймс перестал публиковать свои Abstracts в 1988 г., а большинство продуктов, призванных его заменить, либо были недостаточно хороши, либо прекратили свое существование во время длительных забастовок бейсболистов в 1994–1995 гг. Первый выпуск «Baseball Prospectus», опубликованный в 1996 г., распечатывался на лазерном принтере, из него по ошибке исчезла вся информация о клубе St. Louis Cardinals, и продано было всего 75 экземпляров. Однако у «Baseball Prospectus» быстро появились свои поклонники, а продажи начали расти в геометрической прогрессии практически каждый год.
«Baseball Prospectus» был настоящей сладостной мечтой любого фаната статистики. В нем собиралось неимоверное количество цифр, не только по игрокам основной лиги, но и по потенциальным игрокам, игравшим во второстепенных командах.
Тексты в бюллетене порой носили эзотерический характер, там часто упоминались герои мультсериала «Симпсоны», допускались шутки о полузабытых порнофильмах 1980‑х гг. и даже саркастические оценки нелюбимых издателем менеджеров различных команд.
Однако самыми важными публикациями этого издания были предсказания о том, как будет играть каждый игрок в следующем сезоне. Для этого Хакебей использовал созданную им самим систему под названием Vladimir. Казалось, что она будет следующим шагом в начатой Джеймсом революции.
Хорошая система бейсбольных прогнозов должна выполнять три основные задачи.
1. Принимать во внимание текущий статус статистики игрока.
2. Разделять навыки и удачу.
3. Понимать, каким образом изменяется результативность игрока по мере его взросления – эта закономерность известна под названием кривой старения.
Первая задача сравнительно проста. Бейсбольные соревнования, наиболее уникальные из основных американских видов спорта, всегда проводились на полях с нестандартными размерами. Среднему игроку значительно проще показывать хорошие результаты в уютном квадратном Фенвей-парке (контуры которого заданы компактными улицами Новой Англии), чем на напоминающем пещеру стадионе «Доджер», окруженном огромными парковками. Наблюдая за тем, как ведут себя игроки при игре дома и в гостях, мы можем рассчитать так называемый фактор парка, позволяющий учитывать степень сложности, с которой сталкивается игрок. Например, Фред Линн, основной игрок Red Sox в 1970‑е гг., добивался результата 0,347 во время игр в Фенвей-парке, но его результат на любом другом стадионе был равен лишь 0,264. Аналогичным образом, наблюдая за результатами игроков после перехода из Национальной лиги в Американскую лигу, мы можем довольно четко сказать, какая лига лучше, и оценить силу конкурентной позиции игрока.
Самый масштабный набор данных в мире
Решить вторую задачу – то есть разделить навыки и удачу – намного сложнее. Бейсбол выстроен таким образом, что в краткосрочной перспективе удача играет большую роль – даже лучшие команды проигрывают до трети матчей, и даже лучшие подающие не могут добраться до базы каждые три раза из пяти. Иногда удача не позволяет распознать подлинный уровень навыков игрока даже за целый год. Во время любого сезона бьющий, объективный результат которого 0,275, с вероятностью 10 % может добиться результата 0,300 и, соответственно, с той же вероятностью иметь результат 0,250. И это зависит только от одной лишь удачи