Особенности ранжирования сайтов в Google

Особенности ранжирования сайтов в Google

02.03.2017

Алгоритм поискового ранжирования Google имеет особенности, которые сильно влияют на итоговые позиции сайта.

Анализ текста

При обходе страниц сайта поисковый робот самостоятельно размечает текст документа. В качестве разметки используется обычные html-теги страницы:

  • Теги таблиц и столбцов в них - <table>, <tr>
  • Блочные элементы <div>
  • Тег параграфа <p>
  • Тег переноса строки <br>

При анализе страницы Page Analyzer Component оценивает всю структуру документа, а не только списки.

Особенность текстового ранжирования - удаленность слов оценивается с учетом семантической разметки, а не на основе удаленности в документе. Для корректного построения структуры документа необходимо корректно использовать html-теги и не делать большое количество вхождений ключевых слов в элементы списков.

На основе этого алгоритма страницы, имеющие качественную семантику получают дополнительный бонус при ранжировании.

Анализ ссылок

Поисковый алгоритм очень внимательно относится к входящим ссылкам, особенно к весу ссылок. Расчет веса происходит на основе вероятностной модели перехода по ссылкам реальных пользователей. Наиболее важные характеристики ссылок:

  • Размер ссылки на странице, цвет текста, шрифт.
  • В какой части документа находится ссылка - в шапке или подвале, видно ли ссылку на первом экране, в тексте или в списке.
  • Если ссылка находится в списке, то на какой позиции.
  • Количество слов в тексте ссылки, насколько они носят коммерческий характер.
  • Ссылка текстовая или картинка.
  • Тематичность околоссылочного текста.
  • Ссылка ведет на внешний сайт или на другую страницу текущего сайта.

Важные характеристики сайта-донора:

  • Общее количество ссылок.
  • Наличие слов из ссылки в других частях документа - в заголовках, тексте.
  • К какому кластеру относится документ - насколько близка тематичность ссылки и сайта-донора в целом.

Оценка активности пользователя:

  • Действия на страницах сайта - клики по ссылкам, запонение форм, взаимодействие с интерактивными элементами.
  • История интересов пользователя, на каком языке документы и запросы.
  • Какие ключевые слова использованы в запросе.
  • Оценка кликабельности ссылок на странице - как часто не кликается ни одна ссылка на странице, как часто выбирается другая ссылка для клика.

Ссылки с атрибутом rel="nofollow" не учитываются при анализе пользовательской активности, что еще раз подтверждает, что вес по ним не передается.

Блок ответов в поисковой выдаче

Чтобы сайт попал в блок ответов необходимо соблюдать определенные правила:

  • Существуют определенные шаблоны, определенные модераторами.
  • Целевая поисковая фраза должна входить в заголовок
  • Блок ответов показывается по intent и factual запросам.
  • Чтобы сайт отображался в некоторых тематиках необходимо наличие списка.
  • При классификации документа по тематикам проводится анализ слов в релевантных пассажах - основано на LSI фразах.

Существует черный список шаблонов для попадания в блок ответов. Они применяются в настоящий момент не ко всем языкам, что дает возможность получать больше кликов.

Изменение веса(PR) документа

Google постепенно улучшает систему расчета веса для документов. Все нововведения направлены на защиту от сайтов, которые продвигаются спамными методами. Вес страницы изменяются спустя некоторое время после внесения изменений. Алгоритм пересчета веса:

  • Определяем старый вес документа.
  • Определяем новый вес документа.
  • Выбираем функцию перехода веса.
  • Определяем вес документа на основе функции перехода.
  • Присваиваем новый вес документу.

Стабилизация нового веса документа происходит примерно в течение 70 дней. В первые 20 дней после внесения изменений возможен отрицательный эффект при изменении веса на 10%. Пересчет значений зависит от функции перехода, она может быть выбрана из нескольких - с задержкой времени, отрицательной, случайной.

Определение спама происходит во время действия функции перехода. В случае получения сигналов выше порогового значения срабатывает спам-фильтр и происходит обнуление ранга документа.