Для понимания смысла, который юзер вкладывает в поисковую фразу и того значения, которое раскрывается в публикации, используется нейронная сеть. Она выступает в качестве одного из способов машинного обучения, на котором основывается высчитывание ряда факторов, применяемых в сортировочном алгоритме.
Мы оперируем понятием «смысл» без кавычек, однако важно понимать, что внутреннее содержание, которое определяется посредством машинного алгоритма и тот смысл, который вкладывает в запрос его автор, не могут быть равнозначными понятиями.
Мы ручками оценили качество выдачи по 100 запросам в режиме «Инкогнито» через несколько дней после официального анонса. В результате исследования SERP обоих поисковиков по набору выбранных нами ключей, мы пришли к следующим заключениям:
Какое влияние «Королев» оказывает на поисковую оптимизацию? Особенно существенные изменения прослеживаются для ключей, по которым отсутствуют страницы с точными вхождениями, то есть, с традиционной точки зрения, не хватает необходимого числа соответствующих ответов.
Это означает, что за счет новой категории факторов, ранжирование по среднечастотным и высокочастотным запросам, по которым продвигается большая часть коммерческих сайтов, почти не изменится.
На практике точное вхождение поисковой фразы, если таковое присутствует, имеет большее значение, чем новые факторы ранжирования алгоритма. Документы с такими вхождениями оказываются выше в поисковой выдаче, нежели страницы с угаданными смыслами фраз из «длинных хвостов».
Таким образом, если SEO-специалист проведет мероприятия, способствующие улучшению «традиционных» факторов ранжирования, то страница займет первые места в поиске по нужному низкочастотному запросу. В этом смысле алгоритм «Королев» не внес ничего революционного в процесс.
В ранжировании по коммерческим запросам группа новых факторов алгоритма «Королев», разумеется, может влиять на изменение позиций в ТОП поисковой выдачи. Чтобы улучшить значения по ней, эффективнее всего использовать технологии LSI-копирайтинга.
Чтобы ускорить формирование ответа на пользовательский запрос, в алгоритме используется исключительно финишная формула сортировки. Процесс проходит в несколько стадий, на каждой из которых отбираются кандидаты для следующего, более сложного алгоритма.
Поскольку вычисление смысла является задачей довольно сложной для максимального количества текстов, он не может происходить в несколько секунд. Поэтому с финального этапа ранжирования (как это было реализовано в «Палехе»), он был перемещен на стадию индексирования.
Чтобы ускорить финальный этап ранжирования и освободить вычислительные ресурсы, был разработан и внедрен еще один индекс. Он уже включает в себя предварительно вычисленные сведения о примерной релевантности всех веб-страниц для всех популярных у пользователей высокочастотных ключей, состоящих из одного и двух слов.
Эта мера дала возможность освободить вычислительные мощности для поиска. Без них невозможно отрабатывать сложные модели, которые базируются на нейронных сетях. В данном случае речь идет именно о новом наборе факторов из Королева. Многочисленные оценки асессоров и пользовательские факторы легли в основу обучения нейронной сети. Именно на них оно и опиралось.
Кстати, для того, чтобы увеличить совокупное количество оцененных пар: поисковая фраза-документ, Yandex запустил публичный сервис «Толока». Это позволило во много раз увеличить количество и асессоров, и оценок.
Публично анонсированные примеры не работают, потому что пользовательская модель поведения по ним быстро меняется, а их популярность возрастает.
Формула ранжирования выстраивается в поиске Яндексе с использованием машинного обучения, начиная с 2009 года. Окончательная формула и в настоящее время складывается по методике Матрикснет. Но не все факторы в ней простые, так как получены посредством нейронных сетей. В данном случае подразумевается машинное обучение. В определенном смысле это напоминает матрешку.
В будущем предполагается:
Давайте вмести следить за тем, как события будут развиваться дальше!
Мы перезвоним Вам в течение 30 минут.
Мы перезвоним Вам в течение 30 минут.