Тем не менее, именно тест Тьюринга привел к росту интереса к машинному интеллекту за счет научно неверного, но популярного правила:



Понятно, что это перебор, но так уже сложилось. Таковы законы маркетинга.

лекторий ● Как работает цифровое ранжирование

Завершаем философию цифрового интеллекта и поговорим об умном ранжировании от поисковых компаний.

Наверное, все понимают, что поисковики относятся к тексту, как к набору букв, точнее говоря, неких символов. В свою очередь, каждый символ – это некоторое число. То есть, любой текст трансформируется в поток чисел. Каким образом такой, пусть и большой набор чисел может приобретать знакомый нам, людям смысл? Мы же легко делаем выводы: это умная книга, а это глупые мысли.

Как ни покажется удивительным, во всем мире нет публичных людей, которые могли бы абсолютно достоверно изложить нюансы поисковых технологий от Яндекса или Гугла. Причина, как уже говорилось, банальна, поисковые компании считают свои технологии абсолютной тайной.

Все, что мы можем сказать о поисковых новациях будет построено на дозированных инъекциях от поисковых компаний или на экспериментальном тестировании. Плюс на знании принципов цифрового интеллекта/экспертных систем. Думается, для представителей бизнеса этого будет достаточно для принятия решений по теме, как нужно реагировать на семантическое ранжирование. Конечно, если возникает желание самим создавать системы с искусственным интеллектом, то надо погружаться в специальную литературу.

Начинаем с простых, но малоизвестных моментов.



Поисковики собирают информационные айсберги


Многие пользователи Интернета предполагают, что поисковые компании запоминают их запросы. Это, естественно, так. Ввели запрос, скажем, «лучшая вакансия в Питере», и поисковик занес запрос в свой архив. Плюс занес информацию о заказчике. Мало кто знает, что практически каждая страница Интернета содержит «шпионский» робот от Гугла и Яндекса. Когда пользователь открывает и читает веб-страницу, то робот отсылает поисковикам немало информации: цифровой адрес пользователя, тип компьютера, время просмотра и т.д. Такая шпионская слежка считается легальной во всем мире. Понятно, что роботы появляются с согласия владельцев страниц, взамен владельцы получают отчеты с анализом пользователей. Например, в Яндексе эта система называется «Яндекс.Метрика».

Все отчеты роботов хранятся в гигантских базах данных. Только анализ этих баз может уже дать массу информации, независимо от степени «интеллектуальности» анализирующей системы. Очевидные примеры до-интеллектуальной обработки:

● страницы, которые смотрят, читают долго, имеют более высокий ранг, чем страницы, которые закрывают сразу после открытия;

● по спектру загружаемых страниц можно детализировать профиль пользователя: пол, возраст, социальный статус; исходя из детального профиля можно уточнять ранг страницы.


Для более серьезного анализа используются:



Экспертные системы на нейронных сетях


Экспертные системы возникли примерно 70 лет назад и были основаны на идее использовать человеческий опыт генерации новых знаний. Как мы, люди, производим новые знания? Знания рождаются в результате периодически повторяющегося цикла:

1. поиск эксперта;

2. обучение нового эксперта;

3. новый эксперт становится генератором новых знаний.

Идея экспертных компьютерных систем была простой.

● Стартовым экспертом всегда является человек, специалист в данной области знаний.

● Новым экспертом является компьютер, который должен как-то принять знания от эксперта, стать экспертом и генератором знаний.

Не обязательно, чтобы компьютер, как креативный генератор был умнее эксперта. Эксперты всегда дороги и редки, поэтому возможность хотя бы в чем-то их заменить всегда будет полезной.