Что такое кворум в Яндекс

Что такое кворум в Яндекс

15.11.2016

Причины попадания страниц в выдачу поисковой системы, когда в тексте и ссылках отсутствуют слова из запроса.

В результатах поиска в поисковой системе Яндекс можно обнаружить страницы, которые не содержат части слов запроса ни в самом тексте страницы, ни в анкорах ссылок. Зачастую появляются мифы об учитывании тега alt у изображений или мета-тега description. Данные идеи не имеют обоснования.

Особенности кворума

Чтобы страницы отобразилась в результатах поиска она должна набрать определенный уровень значений, который позволит странице присутствовать в поиске.

Для попадания в результаты поиска у страницы должна быть определенная доля IDF-веса слов из поисковой фразы. Доля вхождений может быть распределена по самой странице, так и по ссылочной массе. Рассмотрим формулу:

Кворум Яндекс

Переменные в формуле:
Q – поисковая фраза
qi – i-ое слово запроса
w(qi) – функция веса слова
D – страница сайта

Данная формула была опубликована еще в 2004 году на одной из конференций сотрудником поискового отдела Денисом Расковаловым.

Значение 0,01 является параметром мягкости и может меняться в зависимости от параметров поиска. В зависимости от данного значения мягкости страница может ранжироваться по запросу, но не иметь всех слов запроса при расчета IDF.

Страница может быть в результатах поиска, если для прохождения кворума ей хватает части слов из запроса. Работу данной схемы легко проверить - взять популярный поисковый запрос и добавить к нему либо несуществующее слово, либо крайне редкое слово, которое не тематично.

Наличие синонимов

В документе страницы можно встретить слова-синонимы запроса в тексте страницы или анкорах ссылок. В этом случае страница также будет ранжироваться по поисковой фразе.

Тут следует отметить важную особенность поисковой системы - в результатах поиска подсвечиваются далеко не все слова-синонимы. Данная ситуация может вносить путаницу в понимание процесса ранжирования. Для определения синонимов можно использовать параметр "nosyn" в URL страницы поиска.

Также следует различать синонимы запроса от синонимов отдельных слов запроса. При различном построении запроса слово может быть синонимом, а может им и не являться.

Параметры URL

Довольно популярная ситуация ранжирования страницы по запросу, когда в URL страницы содержится часть слов из запроса. Вхождения слов написаны, как правило, на транслите. Наличие части слов в URL значительно повышает шансы страницы пройти кворум.

Как и в предыдущем примере, в поисковой выдаче подсвечиваются далеко не все виды транслитерации, которые понимает поисковая система.

История запросов

Каждая страница сайта имеет историю поисковых запросов, по которым на страницу осуществлялись переходы. В Яндекс эти данные называются запросным индексом. Возможно, что страница может быть ранжируема в поиске только за счет данной истории. На текущий момент говорить со 100-процентной вероятностью о данном факторе нельзя, однако логика в данной теории присутствует.

Учет различных зон страницы

Алгоритм поиска в Яндексе настроен таким образом, что некоторые зоны документов не включаются в текстовый индекс - мета-теги description и keywords, а также теги alt и title у изображений. Как показывает практика поисковые системы могут начать учитывать часть факторов, поэтому необходимо осуществлять контроль за данными параметрами. Например, в поисковой системе Google переспам в мета-теге keywords может существенно понизить сайт в поиске, хотя представители Google официально заявляли о не учитывании значений данного мета-тега.