tgoop.com/cryptovalerii/742
Create:
Last Update:
Last Update:
Немного удивляют комментарии вокруг DeepSeek, особенно относительно заявленной эффективности тренировки.
Как будто люди забыли, что GPT-2 сейчас можно обучить уже на ноутбуке, в то время как изначально требовался кластер GPU.
В целом в машинном обучении всегда так: сначала нужно много вычислительных ресурсов, чтобы найти правильный путь, а повторить его затем значительно проще.
На сколько инференс чат гпт подешевел за год? А за два ?
Не говоря уже про многое другое, что, конечно, не отменяет того, что китайцы - крутые пацаны
Статья в тему - The Rise of DeepSeek: What the Headlines Miss
BY Время Валеры
Share with your friend now:
tgoop.com/cryptovalerii/742