ПоискПочтаКартыМаркетНовостиСловариБлогиВидеоКартинки
Войти

Технологии / Поисковые технологии

Поисковые технологии

Каждый день поиском Яндекса пользуются миллионы людей. Они печатают запрос в строке поиска и сразу же получают ответ. При этом мало кто задумывается, как же это всё работает. Да и задумываться особо некогда — весь процесс поиска занимает несколько мгновений. Шестерёнки не скрежещут, карточки не шелестят, женщина в окошке не говорит: «За этим надо обращаться в архив, заполните заявку и возвращайтесь через три рабочих дня». Всё просто — вопрос-ответ.

Но на самом деле между вопросом и ответом находится очень много всего. В этом разделе рассказывается о поисковых технологиях Яндекса. Любой желающий может узнать, как поисковая машина успевает находить документы за доли секунды, как борется с вирусами и спамом, что такое Матрикснет и колдунщики и многое-многое другое.

Научные статьи и отчёты

2011 год

Winning The Transfer Learning Track of Yahoo!'s Learning To Rank Challenge with YetiRank Смотреть PDF

To find out or to buy? Product review vs. Web shop classifier Смотреть PDF

Parallel large-scale feature selection Смотреть PDF

Search Snippet Evaluation at Yandex: Lessons Learned and Future Directions Смотреть PDF

Building a Web-based parallel corpus and filtering out machinetranslated text Смотреть PDF

2010 год

YetiRank: Everybody Lies Смотреть PDF

BagBoo: a scalable hybrid bagging-the-boosting model Смотреть PDF

Application of Additive Groves to the Learning To Rank Challenge Смотреть PDF

CTR prediction based on click statistic Смотреть PDF

2009 год

Combining Anchor Text Categorization and Graph Analysis for Paid Link Detection Смотреть PDF + русская версия

Оптимизация алгоритмов ранжирования методами машинного обучения Смотреть PDF

Поиск неестественных текстов Смотреть PDF

Все статьи и отчёты

 

Robots.txt — создать, заполнить, запретить 01:50

Для просмотра видео необходима включить поддержку Javascript.

Для просмотра видео установите проигрыватель Adobe Flash Player.

ruпо-русски