Факторы спамного документа

Факторы спамного документа

16.11.2016

Как заметить чрезмерную спамность страницы при проведении оптимизации? Основные признаки.

В процессе внутренней оптимизации сайта неопытные специалисты легко могут увлечься процессом и превратить обычную страницу сайта в "монстра" с раздутыми html-тегами и плохо читаемым текстом. Все перечисленные проблемы, как правило, встречаются на сайтах коммерческой тематики. Следует периодически проверять данные параметры.

Признаки спама в невидимой части страницы

У каждой страницы есть тег head, внутри которого идет подключение стилей и скриптов, настройка индексации, а также указываются значения title и мета-тегов. Признаки спама:

  • Длина тега title превышает 12 слов.
  • В мета-теге description содержится больше 40 слов.
  • В мета-теге keywords находится более 20 слов. Мы не рекомендуем указывать более 3 слов.

Признаки спама в контенте страницы

Далее мы оцениваем непосредственно видимую часть документа - контент, который находится внутри тега body. Признаки спама:

  • Частота вхождения любого слова на странице больше 5%, исключением тут могут быть страницы каталога с одинаковым названием товаров.
  • В тексте можно увидеть перечисления ключевых фраз, по которым продвигается данная страница. Это один из старых методов оптимизации.
  • Страница по факту является результатами поиска по сайту и это никак не скрыто.
  • Страница является нечетким дублем другой страницы - контент повторяется, а страница собирает поисковый трафик.
  • Частое использование различных тегов в оформлении контента - переизбыток тегов u, i, strong, b, em, также сюда можно добавить переизбыток заголовков h1-h6.
  • Страница не содержит полезной информации - часто тут выявляется ошибка настройки каталога. Товар в каталоге уже удален, однако страница возвращает код 200 и выводит, что такого элемента нет в каталоге.
  • Контент и мета-теги не отображают реального наполнения страницы - например попытка оптимизации по запросам с вхождением слов "фото" или "видео" в запрос.
  • Сайт в целом является сайтом не существующей компании - нет контактов, дешевый дизайн и некачественный контент.
  • Текстовый контент является сгенерированным - довольно легко понять, что контент сгенерирован, как правило он абсолютно бессмыслен.

Редиректы

При попадании пользователя на страницу сайта осуществляется перенаправление на другую страницу. Страница используется для перенаправления трафика и не имеет собственной реальной ценности.

Html-код

Частые проблемы внутренней оптимизации, связанные с html-кодом страницы:

  • В коде документа переизбыток ключевых слов - в атрибутах alt и title, в различных рабочих скриптах для описания изображений слайдеров и т.п.
  • Часть текстового контента не отображается на странице, либо оформлена неудобно для чтения.
  • В контенте содержатся ссылки на страницы с некачественным или спамным контентом.

Особенности ранжирования

При определении спамности необходимо исходить из особенностей тематики и текущего состояния сайта. Молодые сайты без накопленной истории чаще других подвергаются наказаниям. Также следует заметить, что поисковая система анализирует характеристики всего сайта прежде чем забанить страницу.

Рекомендуем уделять особое внимание качеству контента - экономия и наполнения сайта некачественными текстами негативно скажется непосредственно на сайте, так и на репутации компании. Ситуация может быть совсем плачевной - копирайтер сделал большое количество вхождений в тексте, а поисковая система посчитала текст не качественным или сгенерированным. Более подробно про фильтр переспама можно прочитать здесь.