AI_MACHINELEARNING_BIG_DATA Telegram 7097
πŸ“Œ Набор датасСтов ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ ΠΎΡ‚ HF.

HuggingFace, Π²ΠΎΠΎΠ΄ΡƒΡˆΠ΅Π²ΠΈΠ²ΡˆΠΈΡΡŒ ΠΏΠΎΠ±Π΅Π΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ OlympicCoder Π½Π°Π΄ Sonnet 3.7 Π² Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°Ρ… LiveCodeBench ΠΈ Π² заданиях ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΎΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ 2024 Π³ΠΎΠ΄Π°, ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π½Π°Π±ΠΎΡ€ датасСтов для ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния ΠΈ Ρ‚ΠΎΠ½ΠΊΠΎΠΉ настройки LLM Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ΄Π°:

🟒Stack-Edu - 125 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΊΠΎΠ΄Π° Π½Π° 15 языках программирования, ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΈΠ· The Stack v2

🟒GitHub Issues - 11 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈΠ· GitHub Issues

🟒Kaggle Notebooks - 2 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π½ΠΎΡƒΡ‚Π±ΡƒΠΊΠΎΠ² Kaggle ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…

🟒CodeForces problems - 10 тыс. ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈΠ· сСрвиса CodeForces, 3 тыс ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ Π±Ρ‹Π»ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ Π² массив обучСния, использовавшийся DeepMind

🟒CodeForces problems DeepSeek-R1 - 8,69 Gb ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… трассировок рассуТдСний ΠΏΠΎ Π·Π°Π΄Π°Ρ‡Π°ΠΌ CodeForces

🟒International Olympiad in Informatics: Problem statements dataset (2020 - 2024) - ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΈΠ· Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ, Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹ΠΉ Π½Π° ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ запрос соотвСтствовал Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ этих ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡

🟒International Olympiad in Informatics: Problem - DeepSeek-R1 CoT dataset (2020 - 2023) - 11 тыс трассировок рассуТдСний, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Π½Ρ‹Ρ… DeepSeek-R1 Π² Ρ…ΠΎΠ΄Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ


@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ‘63❀19πŸ”₯9



tgoop.com/ai_machinelearning_big_data/7097
Create:
Last Update:

πŸ“Œ Набор датасСтов ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ ΠΎΡ‚ HF.

HuggingFace, Π²ΠΎΠΎΠ΄ΡƒΡˆΠ΅Π²ΠΈΠ²ΡˆΠΈΡΡŒ ΠΏΠΎΠ±Π΅Π΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ OlympicCoder Π½Π°Π΄ Sonnet 3.7 Π² Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°Ρ… LiveCodeBench ΠΈ Π² заданиях ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΎΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ 2024 Π³ΠΎΠ΄Π°, ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π½Π°Π±ΠΎΡ€ датасСтов для ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния ΠΈ Ρ‚ΠΎΠ½ΠΊΠΎΠΉ настройки LLM Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ΄Π°:

🟒Stack-Edu - 125 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΊΠΎΠ΄Π° Π½Π° 15 языках программирования, ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΈΠ· The Stack v2

🟒GitHub Issues - 11 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈΠ· GitHub Issues

🟒Kaggle Notebooks - 2 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π½ΠΎΡƒΡ‚Π±ΡƒΠΊΠΎΠ² Kaggle ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…

🟒CodeForces problems - 10 тыс. ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈΠ· сСрвиса CodeForces, 3 тыс ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ Π±Ρ‹Π»ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ Π² массив обучСния, использовавшийся DeepMind

🟒CodeForces problems DeepSeek-R1 - 8,69 Gb ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… трассировок рассуТдСний ΠΏΠΎ Π·Π°Π΄Π°Ρ‡Π°ΠΌ CodeForces

🟒International Olympiad in Informatics: Problem statements dataset (2020 - 2024) - ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΈΠ· Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ, Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹ΠΉ Π½Π° ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ запрос соотвСтствовал Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ этих ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡

🟒International Olympiad in Informatics: Problem - DeepSeek-R1 CoT dataset (2020 - 2023) - 11 тыс трассировок рассуТдСний, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Π½Ρ‹Ρ… DeepSeek-R1 Π² Ρ…ΠΎΠ΄Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ


@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace

BY Machinelearning




Share with your friend now:
tgoop.com/ai_machinelearning_big_data/7097

View MORE
Open in Telegram


Telegram News

Date: |

Invite up to 200 users from your contacts to join your channel According to media reports, the privacy watchdog was considering β€œblacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. β€œHey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group. Telegram desktop app: In the upper left corner, click the Menu icon (the one with three lines). Select β€œNew Channel” from the drop-down menu. Ng, who had pleaded not guilty to all charges, had been detained for more than 20 months. His channel was said to have contained around 120 messages and photos that incited others to vandalise pro-government shops and commit criminal damage targeting police stations.
from us


Telegram Machinelearning
FROM American