в своей книге 1964 года “Понимание медиа: внешние расширения человека”. Он имел в виду, что структура нового средства передачи информации – электрического света, телефона, телевидения – важнее содержания, которое через него передается. Сама способность телефона соединять людей превосходит любой конкретный разговор. Маклюэн писал: “Ибо «сообщением» любого средства коммуникации, или технологии, является то изменение масштаба, скорости или формы, которое привносится им в человеческие дела”. В нашем случае средством передачи является алгоритмическая лента; она масштабирует и ускоряет взаимосвязь людей по всему миру до невообразимой степени. Смысл ее функции заключается в том, что на каком-то уровне наши коллективные потребительские привычки, переведенные в данные, приводят к одинаковости.

Как работают рекомендательные алгоритмы

Алгоритмы – это цифровые машины, которые, подобно конвейеру на фабрике, превращают серию входных данных в определенный результат на выходе. Отличие одного алгоритма от другого заключается не столько в структуре, сколько в компонентах, из которых они строятся. Все рекомендательные алгоритмы работают, собирая набор исходных данных. Общий термин для этого набора данных – “сигнал”, собранные входные данные, которые поступают в машину. Этот сигнал может включать в себя сведения о прошлых покупках пользователя на Amazon или о том, сколько других пользователей отдали предпочтение определенной песне на Spotify. Подобные сведения имеют не качественную, а количественную форму, поскольку их должна обрабатывать машина. Поэтому даже если эти данные относятся к такой субъективной теме, как музыкальные предпочтения, они выражаются цифрами: х пользователей поставили группе y среднюю оценку z, или х пользователей прослушали треки группы y z раз. Основным сигналом для многих рекомендаций в социальных сетях является проявление интереса, или вовлеченность, которая описывает, каким образом пользователи взаимодействуют с контентом. Это может выражаться в лайках, ретвитах или просмотрах – всевозможные кнопки, расположенные рядом с постом. Высокая вовлеченность означает, что количество лайков, просмотров или перепостов у данного сообщения выше, чем у других.

Этот сигнал проходит через преобразователь данных, который превращает его в пакеты, предназначенные для обработки различными алгоритмами. Данные о вовлеченности можно отделить от данных о рейтингах или от данных о тематике самого контента. Чтобы добавить информацию об отношениях пользователей друг к другу в рамках одной платформы, можно использовать социальный калькулятор – например, я часто просматриваю в Инстаграме посты моего друга Эндрю, и это заставляет систему рекомендаций с большей вероятностью ставить его посты на первое место в моей персональной ленте.

Далее идет конкретное уравнение индивидуального алгоритма. В современных платформах очень редко работает лишь один алгоритм – обычно их много. Мы имеем дело с целым набором различных уравнений, которые учитывают переменные и обрабатывают их несколькими способами. Одно уравнение рассчитывает результат, основываясь только на вовлеченности (например, находит контент с самой высокой средней вовлеченностью), в то время как другое отдает приоритет социальному контексту контента для конкретного пользователя. Эти алгоритмы также получают тот или иной показатель приоритета относительно друг друга. Комбинированная фильтрация – технология, в рамках которой используется несколько методов. Наконец, на выходе получается сама рекомендация – следующая песня в автоматическом плейлисте или упорядоченный список постов. Алгоритм определяет, например, что сообщение из жизни друга появится в вашей ленте Фейсбука выше политических новостей.