✅ Итоги RecSys трека DataFest’а на сегодня
➡️ SASRec, BERT4Rec — уже классика, почти все спикеры упомянули их.
➡️ Трансформеры круто, масштабируются, могут реранжировать, рекомендовать и тд и дешевле быстрее кетбуста (если много данных)
➡️ DSSM — балдежно если надо искать схожести, тоже частенько говорили.
➡️ Дистиляция модели вполне может быть через категории, например в авито, вк — рекомендации строятся на категориях, а не товарах.
➡️ Подход с определением предпочтений категорий товаров или каких-то ниш частенько прослеживается на разных этапах рекомендаций (например: кино, посты, актеров, рестораны, театры), как в Cold Start так и основных персонализациях.
➡️ Пару раз упомянули сегментацию эмбеддингов ALS.
➡️ Графы улучшают хвост рекомендаций и находят зависимости CF.
➡️ В кандидаты можно пихать разные статистики Top-K рекомендаций.
➡️ Эмбеддинги картинок почти не дают приросты, проще превращать их в текст.
➡️ Тренды и топ папиры смотреть
в посте с Кириллом выше☝🏻
💬 Если я что-то забыл пишите в комменты