Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37
Warning: file_put_contents(aCache/aDaily/post/wildrecsys/--): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50 WildRecSys@wildrecsys P.25
Разнообразие выдач - общая проблема для целого ряда моделей, и бороться с ней можно по разному. В трансформерах, например, экспериментировать с маскированием, сессиями, использовать другие механизмы внимания (кстати, мы переехали с ALBERT на DeBERTa и повысили coverage в 2 раза 🚓) и т.д.
Но есть и довольно быстро реализуемые, и простые для внедрения способы, которые подойдут как для user2item моделей, так и для item2item на историях.
⚓️ Первый - это опорные товары, они же якорные товары, они же позитивы по истории. Суть в том, что мы рассматриваем историю взаимодействий юзера не целиком, а отбираем определенный набор товаров. Например, двигаемся с конца и берем только N товаров определенной категории, а остальные, той же категории, дальше по истории, выкидываем. Итоговую цепочку подаем в модель.
Помогает в тех случаях, когда юзер взаимодействует только с определенным пулом товаров или категорий (corner case - любитель чая с двадцатью чаями подрят в истории) и надо этот байас убрать, чтобы моделька на нем не циклилась, а подсовывала больше различных товаров.
Вместо наивных отборов айтемов, можно натравить на историю MMR / DPP / pDPP, но, по субъективному опыту, сильных эффектов это не оказывает.
⚡ Второй способ - это квоты. Предположим, что нам в выдаче нужно 200 товаров. Давайте, про запас, проскорим тысячу, а потом, не ломая релевантность, наложим фильтр - если категория товара выше по выдаче встретилась больше N раз - такой айтем мы выкидываем. В итоге, финальная выдача кандидатной модели будет гарантированно иметь нужное разнообразие, а значит на этапе переранжирования мы всегда сможем гарантировать это свойство и для финальной выдачи.
В какой-то момент мы внедрили эти практики во все наши кандидатные модели и забустили разнообразие выдачи с реранкера в несколько раз, чего и вам желаем 👋
Разнообразие выдач - общая проблема для целого ряда моделей, и бороться с ней можно по разному. В трансформерах, например, экспериментировать с маскированием, сессиями, использовать другие механизмы внимания (кстати, мы переехали с ALBERT на DeBERTa и повысили coverage в 2 раза 🚓) и т.д.
Но есть и довольно быстро реализуемые, и простые для внедрения способы, которые подойдут как для user2item моделей, так и для item2item на историях.
⚓️ Первый - это опорные товары, они же якорные товары, они же позитивы по истории. Суть в том, что мы рассматриваем историю взаимодействий юзера не целиком, а отбираем определенный набор товаров. Например, двигаемся с конца и берем только N товаров определенной категории, а остальные, той же категории, дальше по истории, выкидываем. Итоговую цепочку подаем в модель.
Помогает в тех случаях, когда юзер взаимодействует только с определенным пулом товаров или категорий (corner case - любитель чая с двадцатью чаями подрят в истории) и надо этот байас убрать, чтобы моделька на нем не циклилась, а подсовывала больше различных товаров.
Вместо наивных отборов айтемов, можно натравить на историю MMR / DPP / pDPP, но, по субъективному опыту, сильных эффектов это не оказывает.
⚡ Второй способ - это квоты. Предположим, что нам в выдаче нужно 200 товаров. Давайте, про запас, проскорим тысячу, а потом, не ломая релевантность, наложим фильтр - если категория товара выше по выдаче встретилась больше N раз - такой айтем мы выкидываем. В итоге, финальная выдача кандидатной модели будет гарантированно иметь нужное разнообразие, а значит на этапе переранжирования мы всегда сможем гарантировать это свойство и для финальной выдачи.
В какой-то момент мы внедрили эти практики во все наши кандидатные модели и забустили разнообразие выдачи с реранкера в несколько раз, чего и вам желаем 👋
Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place. Private channels are only accessible to subscribers and don’t appear in public searches. To join a private channel, you need to receive a link from the owner (administrator). A private channel is an excellent solution for companies and teams. You can also use this type of channel to write down personal notes, reflections, etc. By the way, you can make your private channel public at any moment. While some crypto traders move toward screaming as a coping mechanism, many mental health experts have argued that “scream therapy” is pseudoscience. Scientific research or no, it obviously feels good. According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. bank east asia october 20 kowloon
from us