BIGDATAI Telegram 1224
Forwarded from Machinelearning
πŸ“Œ Набор датасСтов ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ ΠΎΡ‚ HF.

HuggingFace, Π²ΠΎΠΎΠ΄ΡƒΡˆΠ΅Π²ΠΈΠ²ΡˆΠΈΡΡŒ ΠΏΠΎΠ±Π΅Π΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ OlympicCoder Π½Π°Π΄ Sonnet 3.7 Π² Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°Ρ… LiveCodeBench ΠΈ Π² заданиях ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΎΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ 2024 Π³ΠΎΠ΄Π°, ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π½Π°Π±ΠΎΡ€ датасСтов для ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния ΠΈ Ρ‚ΠΎΠ½ΠΊΠΎΠΉ настройки LLM Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ΄Π°:

🟒Stack-Edu - 125 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΊΠΎΠ΄Π° Π½Π° 15 языках программирования, ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΈΠ· The Stack v2

🟒GitHub Issues - 11 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈΠ· GitHub Issues

🟒Kaggle Notebooks - 2 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π½ΠΎΡƒΡ‚Π±ΡƒΠΊΠΎΠ² Kaggle ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…

🟒CodeForces problems - 10 тыс. ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈΠ· сСрвиса CodeForces, 3 тыс ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ Π±Ρ‹Π»ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ Π² массив обучСния, использовавшийся DeepMind

🟒CodeForces problems DeepSeek-R1 - 8,69 Gb ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… трассировок рассуТдСний ΠΏΠΎ Π·Π°Π΄Π°Ρ‡Π°ΠΌ CodeForces

🟒International Olympiad in Informatics: Problem statements dataset (2020 - 2024) - ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΈΠ· Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ, Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹ΠΉ Π½Π° ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ запрос соотвСтствовал Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ этих ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡

🟒International Olympiad in Informatics: Problem - DeepSeek-R1 CoT dataset (2020 - 2023) - 11 тыс трассировок рассуТдСний, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Π½Ρ‹Ρ… DeepSeek-R1 Π² Ρ…ΠΎΠ΄Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ


@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ‘5❀4πŸ”₯3



tgoop.com/bigdatai/1224
Create:
Last Update:

πŸ“Œ Набор датасСтов ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ ΠΎΡ‚ HF.

HuggingFace, Π²ΠΎΠΎΠ΄ΡƒΡˆΠ΅Π²ΠΈΠ²ΡˆΠΈΡΡŒ ΠΏΠΎΠ±Π΅Π΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ OlympicCoder Π½Π°Π΄ Sonnet 3.7 Π² Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°Ρ… LiveCodeBench ΠΈ Π² заданиях ΠœΠ΅ΠΆΠ΄ΡƒΠ½Π°Ρ€ΠΎΠ΄Π½ΠΎΠΉ ΠΎΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ 2024 Π³ΠΎΠ΄Π°, ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π½Π°Π±ΠΎΡ€ датасСтов для ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния ΠΈ Ρ‚ΠΎΠ½ΠΊΠΎΠΉ настройки LLM Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ΄Π°:

🟒Stack-Edu - 125 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΊΠΎΠ΄Π° Π½Π° 15 языках программирования, ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… ΠΈΠ· The Stack v2

🟒GitHub Issues - 11 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈΠ· GitHub Issues

🟒Kaggle Notebooks - 2 ΠΌΠ»Ρ€Π΄. Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π½ΠΎΡƒΡ‚Π±ΡƒΠΊΠΎΠ² Kaggle ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…

🟒CodeForces problems - 10 тыс. ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈΠ· сСрвиса CodeForces, 3 тыс ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ Π±Ρ‹Π»ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Ρ‹ Π² массив обучСния, использовавшийся DeepMind

🟒CodeForces problems DeepSeek-R1 - 8,69 Gb ΠΎΡ‚Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… трассировок рассуТдСний ΠΏΠΎ Π·Π°Π΄Π°Ρ‡Π°ΠΌ CodeForces

🟒International Olympiad in Informatics: Problem statements dataset (2020 - 2024) - ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΈΠ· Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ, Ρ€Π°Π·Π±ΠΈΡ‚Ρ‹ΠΉ Π½Π° ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ запрос соотвСтствовал Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ этих ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ‡

🟒International Olympiad in Informatics: Problem - DeepSeek-R1 CoT dataset (2020 - 2023) - 11 тыс трассировок рассуТдСний, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½Π½Ρ‹Ρ… DeepSeek-R1 Π² Ρ…ΠΎΠ΄Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Π½ΠΈΠΉ ΠžΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ‹ ΠΏΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ


@ai_machinelearning_big_data

#AI #ML #LLM #Dataset #HuggingFace

BY Big Data AI




Share with your friend now:
tgoop.com/bigdatai/1224

View MORE
Open in Telegram


Telegram News

Date: |

In the next window, choose the type of your channel. If you want your channel to be public, you need to develop a link for it. In the screenshot below, it’s ”/catmarketing.” If your selected link is unavailable, you’ll need to suggest another option. Telegram iOS app: In the β€œChats” tab, click the new message icon in the right upper corner. Select β€œNew Channel.” Select β€œNew Channel” How to Create a Private or Public Channel on Telegram? Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place.
from us


Telegram Big Data AI
FROM American