Яндекс за свою историю выпустил ряд крупных обновлений алгоритмов ранжирования, зачастую получавших кодовые названия (часто – в честь городов или понятий). Ниже перечислены ключевые этапы и изменения:
- Ранние годы (1990-е) – изначально ранжирование строилось на простых текстовых метриках: положение и частота ключевых слов на странице, расстояние между ними. В 1999 году введен тематический индекс цитирования (тИЦ) – показатель авторитетности сайта по ссылкам, сильно влиявший на позиции в поиске. Одновременно улучшались антиспам-фильтры.
- Начало 2000-х – поисковик начал учитывать новые факторы: синтаксический анализ текста (2000), число и качество внешних ссылок и анкоры (2001). Появились первые попытки учитывать поведение пользователей (“Популярные находки” 2000). В 2004 году в ранжирование внедрены асессорские оценки качества сайтов, улучшена региональность поиска.
- Появление «городских» алгоритмов (2008–2010) – в 2008 году Яндекс начинает давать названия ключевым обновлениям. Первое – «Магадан» (май 2008), увеличившее вдвое число факторов и научившее поиск лучше различать типы страниц, понимать аббревиатуры и многословные запросы. Далее вышли Магадан 2.0 (лето 2008, учет уникальности контента, определение adult-контента, классификация запросов по гео и коммерческости), «Находка» (сентябрь 2008, улучшенное учитывание стоп-слов и новый алгоритм машинного обучения). В 2009 году – серия обновлений «Арзамас» (апрель и далее): снятие омонимии запросов, учет региона пользователя, классификатор геозависимости запросов и запуск регионального ранжирования (поначалу для Москвы, СПб, Екб, затем еще 16 городов). Конец 2009 ознаменовался запуском технологии машинного обучения MatrixNet в алгоритме «Снежинск» – резкий рост числа факторов и появление уникальных формул для разных групп запросов. Одновременно запущены антиспам-фильтры АГС-17 и АГС-30 для борьбы с линкопомойками (конец 2009), а также расширено региональное ранжирование до 1250 городов РФ («Конаково», декабрь 2009). В 2010 вышел алгоритм «Обнинск» (оптимизация формулы для геонезависимых запросов, снижение влияния SEO-ссылок). Конец 2010 – обновление «Краснодар» с технологией «Спектр» для многозначных запросов: поиск стал выдавать разнообразные результаты по разным интентам одного запроса.
- Персонализация и поведение (2011–2014) – «Рейкьявик» (август 2011) – первый шаг к персонализированному поиску. Алгоритм учитывает языковые предпочтения пользователя: если человек часто ищет по-английски, в выдаче будет больше англоязычных сайтов. Также с Рейкьявика в поиске появились первые интерактивные блоки-колдунщики. «Калининград» (декабрь 2012) – полноценная персонализация результатов: учет долгосрочных интересов пользователя, истории запросов и кликов. «Дублин» (май 2013) – учет сиюминутных интересов в рамках текущей поисковой сессии пользователя. В 2013 же году запущена платформа «Острова» – интерактивные ответы прямо на поиске (формы заказа, бронирования и т.п.) – однако концепция не прижилась и позже была свернута. В 2013 обновлен антиспам-фильтр АГС-40 (борьба с новыми ухищрениями линкоспама). В 2014 Яндекс совершил эксперимент, временно отключив учет ссылок для коммерческих запросов в Москве (известно как отмена ссылочного ранжирования, кодовое название «Началово») – чтобы снизить влияние покупных ссылок. Это решение вызвало споры; впоследствии прямой отказ от всех ссылок не прижился, но тренд на снижение влияния низкокачественного линкбилдинга продолжился.
- Борьба с SEO-манипуляциями (2015–2017) – «Минусинск» (апрель 2015) – знаковый алгоритм, который пессимизировал сайты, скупающие некачественные SEO-ссылки. Многие коммерческие сайты потеряли позиции. Это встряхнуло рынок: оптимизаторы переориентировались на качество контента и получение естественных ссылок, вместо массовой скупки. Позже фильтр ослабили, но сам факт учета ссылочной репутации остался. Осенью 2015 введена технология «Многорукий бандит» – рандомизированное подмешивание в выдачу разных вариантов результатов для сбора поведенческих данных. В 2016 алгоритм «Владивосток» учел мобильную революцию: пометка mobile-friendly сайтов и объявление мобильной адаптивности фактором ранжирования. «Палех» (ноябрь 2016) – первое применение нейросетей для понимания длинных редких запросов: ИИ начал сопоставлять смысл запроса со смыслом текста на страницах (поначалу – анализируя заголовки). «Баден-Баден» (март 2017) – алгоритм борьбы с переоптимизацией текста (переспамом ключевиков, «тошнотой» контента). Сайты с переоптимизированными или скрытыми текстами начали понижаться в выдаче. «Королев» (август 2017) – развитие «Палеха»: нейросеть научилась понимать смысл всего содержания страницы, а не только заголовка, для более точного соответствия редким запросам.
- Интеграция сервисов и AI-моделей (2018–2019) – Яндекс усилил связь поиска со своими сервисами. В 2018 запущены Индекс Качества Сайта (ИКС) вместо тИЦ (оценка сайта с учётом трафика и поведенческих факторов), и крупный алгоритм «Андромеда» (ноябрь 2018), объединивший накопленные изменения. Андромеда добавила специальные знаки (бейджи) в сниппеты результатов и плотнее встроила в органическую выдачу колдунщики — блоки Картинок, Видео, Маркета и проч. для обогащения SERP. В декабре 2019 представлена «Вега» – масштабное обновление, включившее 1500 улучшений. Среди них: кластеризация поисковой базы нейросетью, пререндеринг результатов для мгновенной загрузки, привлечение асессоров-экспертов для оценки результатов в узких тематиках, гиперлокальный поиск (учет точного местоположения вплоть до микрорайона) и запуск сервиса вопросов-ответов Яндекс.Кью. Обновление «Вега» задало новый вектор развития поиска, объединив достижения по AI и удобству поиска.
