– это процент вхождения запроса к общему объему текста. Для поисковых систем высокорелевантным текстом считается такой, где вхождение запроса в текст примерно равно 4–7 % – меньшего может не хватить, большее чревато тем, что система может счесть текст за поисковый спам и наложит на страницу фильтр.

В ту или иную ИПС заложена конкретная технология представления и структурирования информации. Можно провести следующую классификацию ИПС:

1. Классификационные ИПС. В классификационных ИПС используется иерархическая (древовидная) организация информации, которая называется классификатором. Разделы классификатора называются рубриками. Библиотечный аналог классификационной ИПС – систематический каталог. Классификационные ИПС обладают рядом специфических недостатков. Уже разработка классификатора связана с оценкой относительной важности различных областей человеческой деятельности. Примеры классификационных ИПС: Yahoo, Yellow Web, Созвездие Интернет, Ау.

2. Словарные ИПС. Основная идея словарной ИПС – создать словарь из слов, встречающихся в документах Интернет, в котором при каждом слове будет храниться список документов, из которых взято данное слово. Если поиск слов в таком словаре выполняется быстро, то можно отказаться от услуг разработчиков классификаторов и от услуг систематизаторов, оставаясь один на один с авторами документов. Примеры словарных ИПС: Alta Vista, Яндекс, Апорт.

Купите полную версию книги и продолжайте чтение
Купить полную книгу