WildRecSys@wildrecsys P.25

🚩

Опорные товары и квоты

Разнообразие выдач - общая проблема для целого ряда моделей, и бороться с ней можно по разному. В трансформерах, например, экспериментировать с маскированием, сессиями, использовать другие механизмы внимания (кстати, мы переехали с ALBERT на DeBERTa и повысили coverage в 2 раза

🚓

) и т.д.

Но есть и довольно быстро реализуемые, и простые для внедрения способы, которые подойдут как для user2item моделей, так и для item2item на историях.

⚓️ Первый - это опорные товары, они же якорные товары, они же позитивы по истории. Суть в том, что мы рассматриваем историю взаимодействий юзера не целиком, а отбираем определенный набор товаров. Например, двигаемся с конца и берем только N товаров определенной категории, а остальные, той же категории, дальше по истории, выкидываем. Итоговую цепочку подаем в модель.

Помогает в тех случаях, когда юзер взаимодействует только с определенным пулом товаров или категорий (corner case - любитель чая с двадцатью чаями подрят в истории) и надо этот байас убрать, чтобы моделька на нем не циклилась, а подсовывала больше различных товаров.

Вместо наивных отборов айтемов, можно натравить на историю MMR / DPP / pDPP, но, по субъективному опыту, сильных эффектов это не оказывает.

⚡ Второй способ - это квоты. Предположим, что нам в выдаче нужно 200 товаров. Давайте, про запас, проскорим тысячу, а потом, не ломая релевантность, наложим фильтр - если категория товара выше по выдаче встретилась больше N раз - такой айтем мы выкидываем. В итоге, финальная выдача кандидатной модели будет гарантированно иметь нужное разнообразие, а значит на этапе переранжирования мы всегда сможем гарантировать это свойство и для финальной выдачи.

В какой-то момент мы внедрили эти практики во все наши кандидатные модели и забустили разнообразие выдачи с реранкера в несколько раз, чего и вам желаем 👋

Please open Telegram to view this post

VIEW IN TELEGRAM

www.tgoop.com/wildrecsys/25

2.2K viewsedited Jul 22, 2024 at 14:40

tgoop.com/wildrecsys/25

Create: 2024-07-22
Last Update: 2025-01-23 20:17:04

🚩 Опорные товары и квоты

Разнообразие выдач - общая проблема для целого ряда моделей, и бороться с ней можно по разному. В трансформерах, например, экспериментировать с маскированием, сессиями, использовать другие механизмы внимания (кстати, мы переехали с ALBERT на DeBERTa и повысили coverage в 2 раза 🚓) и т.д.

Но есть и довольно быстро реализуемые, и простые для внедрения способы, которые подойдут как для user2item моделей, так и для item2item на историях.

⚓️ Первый - это опорные товары, они же якорные товары, они же позитивы по истории. Суть в том, что мы рассматриваем историю взаимодействий юзера не целиком, а отбираем определенный набор товаров. Например, двигаемся с конца и берем только N товаров определенной категории, а остальные, той же категории, дальше по истории, выкидываем. Итоговую цепочку подаем в модель.

Помогает в тех случаях, когда юзер взаимодействует только с определенным пулом товаров или категорий (corner case - любитель чая с двадцатью чаями подрят в истории) и надо этот байас убрать, чтобы моделька на нем не циклилась, а подсовывала больше различных товаров.

Вместо наивных отборов айтемов, можно натравить на историю MMR / DPP / pDPP, но, по субъективному опыту, сильных эффектов это не оказывает.

⚡ Второй способ - это квоты. Предположим, что нам в выдаче нужно 200 товаров. Давайте, про запас, проскорим тысячу, а потом, не ломая релевантность, наложим фильтр - если категория товара выше по выдаче встретилась больше N раз - такой айтем мы выкидываем. В итоге, финальная выдача кандидатной модели будет гарантированно иметь нужное разнообразие, а значит на этапе переранжирования мы всегда сможем гарантировать это свойство и для финальной выдачи.

В какой-то момент мы внедрили эти практики во все наши кандидатные модели и забустили разнообразие выдачи с реранкера в несколько раз, чего и вам желаем 👋

Telegram News

🚩 Опорные товары и квоты