WildRecSys@wildrecsys P.19

🏐 Serendipity на главной WB

Принимая эстафету🫵от моего коллеги Вани Максимова, постараюсь раскрыть основные метрики “около-серендипности”, которые мы трекаем при работе с моделями.

В общем случае serendipity - это композиция новизны и релевантности, поэтому при разработке моделей первого уровня мы, при условии неубывания ранжирующих и денежных метрик, стараемся оптимизировать целый ряд novelty метрик:

➡ Global novelty - средняя новизна айтемов в рекомендациях
➡ Category coverage - покрытие категорий моделью
➡ Category user novelty - среднее количество новых категорий для юзера
➡ Category user repeat rate - среднее количество категорий, которые “перетекают” из истории юзера в его рекомендации

Максимизируя на выходе с первого уровня количество кандидатов, обладающих новизной, все что нам нужно сделать - не дать этим айтемам затеряться на втором уровне ранжирования.

Для этого, при обучении на pairwise loss, в таргете, помимо релевантности, мы также учитываем и сводный показатель качества товара, в который входит и частотность по выборке (больше - хуже). Формулу можно посмотреть на слайде с реранкером в реплае, в телеграм с формулами туго.

На выходе получаем, что менее популярный и более качественный товар будет буститься вверх, даже если он менее релевантен юзеру.

Такой подход позволяет не только радовать пользователей “серендипными” товарами, но и частично избавиться от нескольких крупных бизнесовых проблем, таких как рекомендация уже купленного и засилье FMCG товаров в выдачах.

Please open Telegram to view this post

VIEW IN TELEGRAM

www.tgoop.com/wildrecsys/19

2.0K viewsJun 9, 2024 at 15:43

tgoop.com/wildrecsys/19

Create: 2024-06-09
Last Update: 2025-01-23 20:15:09

Telegram News

🏐 Serendipity на главной WB