tgoop.com/data_analysis_ml/3099
Last Update:
⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky.
Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров!
Важно отметить то, что разработчики используют набор данных с открытым исходным кодом.
▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17k
▪Curator: https://github.com/bespokelabsai/curator/
▪32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B
▪7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7B
▪Сode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation
@data_analysis_ml
BY Анализ данных (Data analysis)
![](https://photo2.tgoop.com/u/cdn4.cdn-telegram.org/file/etBKPlGhjo3jRY6UwGo7v5nK--bVd6xYr2qGVoNUAUm1qhLYmXDKjufptvg1DbrNTuJpyn8BLn12zhlys6-Rl0Cp4SUCat0Ycr4J9Gauekiq7pGb-mMjTrawClWU_gsVy9X6oKHjHkNhcmU4pv3A2srmgQfIE2PPoKB0UT3gNmPCVURM58XHDvNRMIyfv2o3mQIhDC8GLbraCu9qhD8QrVrjGv4KxoHEG3YvHsEg5uPT8YdAAS7UnhrQGYt2pSPswGAGupjwf_nnnE7fI2JTKfUjcRjLTvuMFix8Rqo7FvQmiAxP-6PcoIyi-EkEAaQdajh5LnIDCM6r8fnb2axj6A.jpg)
Share with your friend now:
tgoop.com/data_analysis_ml/3099