Новый алгоритм Палех

Новый алгоритм Палех

18.11.2016

Яндекс презентовал новый алгоритм "Палех", который должен улучшать качество поиска за счет нейронных сетей. Главное - это понимание смысла поискового запроса. По факту Яндекс пытается сопоставить смысл запроса и смысл документа.

Низкочастотные запросы

В официальном блоге Яндекс написано, что данный алгоритм направлен на обработку низкочастотных или совсем микрочастотных запросов, которые затем не повторяются. Яндекс приводит статистику таких запросов - 100 миллионов запросов. Сотрудники Яндекса стараются поднять качество ответов именно по этим запросам.

Основная сложность для поисковой системы, при обработке низкочастотных запросов из длинного хвоста, нехватка накопленной статистики по страницам. Нет поведенческой статистики, поэтому сложно понять какой сайт лучше решить задачу пользователя.

Еще одной проблемой является отсутствие части слов из запроса на странице сайта, именно поэтому Яндекс ввел термин "поиска смысла" - пользователь может вбивать запрос по популярной теме, но использовать нетипичные слова для данной тематики. В поисковой выдаче легко обнаружить много "мусора" из-за сниженных показателей кворума по низкочастотным запросам.

Семантические вектора

При внедрении нейронных сетей Яндекс начал выстраивать вектор из 300 параметров для каждой странице при обработке запроса. Именно данный вектор и позволяет повысить качество поиска.

В ближайшее время Яндекс планирует продолжать внедрять такие вектора для текстов, оценивать пользовательскую активность и т.п.

Влияние на реальную жизнь

Это все были разговоры о высоком, теперь необходимо понять во что это выливается на практике. Новый алгоритм потенциально дает больше трафика контентным проектам с качественными и уникальными текстами.

Также наши аналитики сходятся во мнении, что это понизит уровень отдачи трафика дорвеям - они не смогут удовлетворять требованиям нового алгоритма, т.к. в качестве отрицательных примеров нейронная сеть обучалась скорее всего именно на дорвееподобных сайтах.

Пример роста

Один из наших туристических проектов показал очень хорошую динамику роста за последние 3 месяца, хотя новый контент не публиковался:

Рост трафика

Необходимо правильно вести работу по проектам и качество возьмет верх.