tgoop.com/wildrecsys/19
Last Update:
Принимая эстафету
В общем случае serendipity - это композиция новизны и релевантности, поэтому при разработке моделей первого уровня мы, при условии неубывания ранжирующих и денежных метрик, стараемся оптимизировать целый ряд novelty метрик:
Максимизируя на выходе с первого уровня количество кандидатов, обладающих новизной, все что нам нужно сделать - не дать этим айтемам затеряться на втором уровне ранжирования.
Для этого, при обучении на pairwise loss, в таргете, помимо релевантности, мы также учитываем и сводный показатель качества товара, в который входит и частотность по выборке (больше - хуже). Формулу можно посмотреть на слайде с реранкером в реплае, в телеграм с формулами туго.
На выходе получаем, что менее популярный и более качественный товар будет буститься вверх, даже если он менее релевантен юзеру.
Такой подход позволяет не только радовать пользователей “серендипными” товарами, но и частично избавиться от нескольких крупных бизнесовых проблем, таких как рекомендация уже купленного и засилье FMCG товаров в выдачах.