Повысить CTR (click-through rate — показатель кликабельности) за счет показа более релевантных рекламных блоков.
Рекламная система Яндекса строится в 3 этапа: 1. привязка поискового запроса с рекламными объявлениями, 2. фильтрация привязанных объявлений, 3. ранжирование рекламных блоков для выбора места на странице поисковой выдачи.
Необходимо модернизировать 2й этап – фильтрацию привязанных объявлений.
Проанализированы использовавшиеся 20.000 признаков, отвечающих за привязку поискового запроса и рекламного баннера. Признаки были профильтрованы, добавлены новые информативные, общее число сократилось до 8.000.
Проведена модернизация используемых алгоритмов с учетом выявленных зависимостей без увеличения нагрузки на вычислительные узлы и время работы системы.
Предложена двухуровневая модель машинного обучения, состоящая из 15 внутренних классификаторов и 2 внешних.
Модифицированные алгоритмы фильтрации рекламных баннеров на внутренних тестах показали 10% прибавку к CTR. Тест модели в «боевых» условиях показал 8% прибавку.
Двухуровневая модель на внутренних тестах показала 14% прибавку к CTR.
5 ТБ данных проанализировано
20 000 признаков
70 000 000 пар фраза-баннер
8% увеличение CTR
98% выручки Яндекса приходится на рекламу
58.2 млрд. руб. – выручка рекламной системы за 2015 год
Увеличение рекламной выручки
Яндекса от внедрения модели