Модели в эпоху данных
Появление книги о моделях может показаться неуместным в эпоху больших данных, которые сегодня характеризуются беспрецедентной размерностью и степенью детализации. Данные о покупках клиентов, раньше поступавшие в виде ежемесячных совокупных показателей, распечатанных на бумаге, теперь представляют непрерывный поток геопространственных, временных и потребительских тегов. Данные об академической успеваемости студентов теперь включают баллы за каждое домашнее задание, работу, тест и экзамен, в отличие от итоговых оценок в конце семестра. В прошлом фермер мог упомянуть о засушливой почве на ежемесячном собрании ассоциации фермеров. Теперь тракторы передают мгновенные данные о состоянии почвы и уровне влажности в расчете на каждый квадратный метр. Инвестиционные компании отслеживают десятки показателей и тенденций по тысячам акций и используют инструменты обработки текстов на естественных языках для синтаксического анализа документов. Врачи могут страница за страницей получать данные из истории болезни пациентов, в том числе важные генетические маркеры.
Всего каких-то двадцать пять лет назад большинство из нас имели доступ к знаниям, размещавшимся на нескольких книжных полках. Возможно, у вас на работе была небольшая библиотека справочной литературы или коллекция энциклопедий и несколько десятков справочников дома. Хотя ученые и исследователи из правительственного и частного сектора имели доступ к большим библиотечным фондам, им все равно приходилось физически их посещать, чтобы получить необходимые материалы. Даже на рубеже нового тысячелетия еще можно было увидеть, как ученые курсируют туда-сюда между библиотечными картотеками, коллекциями микрофильмов, книжными стеллажами и специальными хранилищами в поисках информации.
Сегодня все по-другому. Контент, веками отображаемый исключительно на бумаге, теперь передается крохотными блоками по воздуху, так же как и информация о событиях, происходящих здесь и сейчас. Новости, приходившие к нам один раз в день в виде газеты, теперь поступают в виде непрерывного цифрового потока на наши персональные устройства. При помощи нескольких движений пальцев или мышки можно узнать курс акций и результаты спортивных соревнований, а также новости о политических и культурных событиях.
Но какими бы впечатляющими ни были данные, это не панацея. Да, теперь мы знаем, что уже произошло или происходит в настоящий момент, но из-за сложности современного мира не всегда способны понять, почему. Выводы, полученные эмпирическим путем, могут вводить в заблуждение. Данные о сдельной оплате труда часто показывают, что чем больше людям платят за единицу продукции, тем меньше они производят. Модель, в которой оплата зависит от условий труда, может объяснить этот парадокс. Если условия плохие и затрудняют выпуск продукции, оплата за единицу продукции может быть высокой. Если условия хорошие, оплата может быть низкой. Таким образом, более высокая оплата не приводит к снижению производительности, скорее наоборот, тяжелые условия труда требуют более высокой оплаты за единицу продукции