ПоискПочтаКартыМаркетНовостиСловариБлогиВидеоКартинки
Войти

На вопросы пользователей отвечает не только поиск по вебу, но и другие сервисы Яндекса. Например, Яндекс.Новости рассказывают, что сейчас происходит в мире, а Яндекс.Погода — при какой температуре и атмосферном давлении это всё в мире происходит. Яндекс ищет ответы на своих сервисах вместе с поиском по вебу и те из них, что хорошо отвечают на запрос, показывает прямо в результатах поиска. Такой поиск называется параллельным, а его результаты, которые появляются, как по волшебству, вместе с результатами веб-поиска — колдунщики. Искать дополнительные ответы на своих сервисах Яндекс впервые стал в 2000 году, подключив к поиску ленту новостей и базу товаров интернет-магазинов.

Сейчас у Яндекса уже много сервисов, у которых могут быть ответы на один и тот же запрос. Например, по запросу [Стинг] помимо ссылок на веб-страницы о музыканте и его творчестве Яндекс также может предложить послушать его песни, которые есть на Яндекс.Музыке, посмотреть фото, найденные Яндекс.Картинками или видеоклипы, найденные Яндекс.Видео.

Колдунщики — это информационные блоки в результатах поиска с ответами от сервисов Яндекса.

Соответственно, на некоторые из запросов в результатах поиска может появляться несколько колдунщиков. Какие колдунщики и в каком порядке показывать — решает специальная система. Она состоит из пяти частей. Четыре из них выясняют, у какого из сервисов Яндекса может быть ответ на запрос. Они называются «кубики», по аналогии с детскими кубиками, где букве алфавита соответствует картинка. Пятая называется «решатель». Решатель «составляет слово» из кубиков — выбирает подходящие колдунщики и ранжирует их.

 

Кубик запросов

У кубика запросов есть список слов-маркеров — если запрос содержит одно из таких слов, скорее всего, будет полезен ответ от одного из сервисов («послушать» — Яндекс.Музыка, «фото» — Яндек.Картинки, «квартира» — Яндекс.Недвижимость и т.д.). Кубик срабатывает только на запросы с этими словами, например, [послушать sting – russians]. Он отправляет в параллельный поиск по сервису остальную часть запроса (уже без самого слова) и сообщает решателю, что это за сервис.

 

Кубик переформулировок

Кубик переформулировок сравнивает приходящие запросы со списком запросов, уже разделённых по темам. В этот список попадают запросы, которые разные пользователи часто и одинаково переформулируют, то есть сначала задают довольно общий запрос, а потом добавляют к нему уточняющие слова. Например, пишут сначала [телевизор], а потом уточняют — [купить телевизор] или пишут название фильма, а потом добавляют «смотреть онлайн».

Яндекс знает, к каким темам относятся наиболее популярные уточняющие слова и, если у запроса много одинаковых переформулировок, относит сам запрос к той же теме. Бывает, что один и тот же запрос пользователи уточняют по-разному. В этом случае для каждой темы запроса определяется её «вес» — коэффициент, рассчитанный исходя из количества переформулировок. То есть для каждого запроса в списке указаны темы, к которым он относится, и вес этих тем. Список постоянно обновляется и дополняется.

Например, пользователь задал запрос [cranberries]. Допустим, что его чаще всего переформулируют в [cranberries песни], чуть реже в [cranberries фото] и совсем редко в [cranberries перевод]. В списке будет указано, что «музыкальный» вес запроса — 0.5, «картиночный» — 0.4, а «словарный» — 0.1. Кубик сообщит об этом решателю, тем самым советуя: ответ от Яндекс.Музыки будет чуть более востребован, чем от Яндекс.Картинок, а колдунщик Яндекс.Словарей, скорее всего, не нужен.

 

Кубик результатов поиска

Яндекс знает не только темы запросов, но и тематики популярных сайтов. Это знание помогает системе понимать тему запроса, про который ничего заранее не известно.

Кубик включается, когда для запроса уже сформированы результаты поиска, но ещё не показаны пользователю. Он смотрит, есть ли среди наиболее релевантных ресурсов, на которые поисковая система предложит перейти пользователю, известные ему сайты и к какой тематике они относятся. Например, если среди них есть несколько сайтов про недвижимость, кубик сообщит об этом решателю — тот будет знать, что может пригодиться ответ от Яндекс.Недвижимости. Когда в результатах поиска в достаточном количестве присутствуют ресурсы на разные темы, кубик рассчитывает вес каждой, основываясь на количестве сайтов, и передаёт данные в решатель.

 

Кубик качества

Некоторые запросы пользователи задают редко, и ответы на них есть лишь на нескольких сайтах. Например, название модели какой-нибудь непопулярной стиральной машины, которая уже снята с производства, но несколько штук ещё осталось в паре магазинов. В таком случае у поисковой системы недостаточно данных, чтобы отнести запрос или сайт к определённой тематике. Кубик качества следит за результатами поисков по сервисам и сообщает решателю, есть ли на одном из них ответ и насколько он точен. Если у параллельного поиска есть хороший ответ (например, предложение о продаже именно этой модели на Яндекс.Маркете), решателю этого будет достаточно, чтобы показать соответствующий колдунщик, даже если остальные кубики ничего не сообщили.

 

Решатель

Каждый из кубиков обрабатывает запрос независимо от ответов остальных кубиков, а затем передаёт данные в решатель (если они есть). На основании этих данных решатель подставляет соответствующие коэффициенты в формулу ранжирования колдунщиков. В формуле учитывается, какие из кубиков дали ненулевой ответ (например, если сработал кубик запросов, решатель, скорее всего, не будет добавлять в формулу данные от остальных) и к каким темам с каким весом относится запрос.

Система, которая ранжирует колдунщики, — самообучаемая, и ранжирование, основанное на данных от кубиков, не окончательное. Допустим, на запрос [бритни спирс] кубик переформулировок передал решателю, что это запрос с «музыкальным» весом — 0.6, «картиночным» — 0.3, а к теме «видео» относится с весом 0.1. Примерно то же самое передал кубик результатов поиска, а кубики запросов и качества ничего про этот запрос не выяснили. Основываясь на этих данных, решатель поставил колдунщик Яндекс.Музыки выше колдунщика Яндекс.Картинок, а колдунщик Яндекс.Видео решил не показывать. Затем система отслеживает — насколько популярны показанные колдунщики у пользователей. И если более популярный изначально оказался ниже, система перенесёт его на верхнюю позицию. А если колдунщик вовсе не пользуется спросом — может вообще не показывать его по этому запросу.

Система ранжирования колдунщиков

 

Предыдущая статья:
Результаты поиска

Читать ещё:
Подсказки

Все поисковые технологии
ruRu