This media is not supported in your browser
VIEW IN TELEGRAM
هوش مصنوعی Grok حالا علاوه بر ساخت عکس، میتونه عکسهایی که میسازه رو هم ویرایش کنه بنابراین اگر از قسمتی از عکسی که ساخته، خوشتون نیومد فقط کافیه روی دکمه Edit With Grok کلیک کنید و تغییری که باید انجام بشه رو به صورت متنی بیان کنید.
این قابلیت از حالا برای تمام کاربران به صورت رایگان عرضه شده و از Grok.x.com در دسترس هست.
🔎 EHuanglu
📍 @TechTube
این قابلیت از حالا برای تمام کاربران به صورت رایگان عرضه شده و از Grok.x.com در دسترس هست.
🔎 EHuanglu
📍 @TechTube
❤🔥87🌭15⚡11❤4🍌2
Forwarded from Limited Gifts
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌50🌭9❤7😡4❤🔥3😁3⚡1
داستان يك تجربه عجيب و جذاب با SSD اکسترنال ADATA
تصور کنید توی یه روز شلوغ کاری هستید...
لپتاپ رو باز میکنید، یه پروژهی بزرگ و حیاتی جلو روتونه، و باید هرچه سریعتر فایلهای سنگین رو منتقل کنید. حالا چی کار میکنید؟!
همینجاست که SSD اکسترنال ADATA مثل یه قهرمان وارد میشه:
سرعتش انقد بالاست که قبل از اینکه حتی یه لیوان چای بخورید، انتقال فایل تموم شده!
💎 کدوم مدل رو انتخاب میکنید؟
🔹 مدل SD810 – برای حرفهایها و عاشقان ماجراجویی!
سرعت تا 2000MB/s، مقاوم در برابر ضربه و سقوط، ضدآب و ضدگردوغبار
با استاندارد IP68
ایدهآل برای عکاسان و فیلمبرداران حرفهای
🔗 جزئیات بیشتر و خرید
🔹 مدل SD620 – مقرونبهصرفه برای همه نیازها!
سرعت تا 520MB/s، طراحی مقاوم، رنگهای متنوع، سازگار با دستگاههای مختلف
🔗 جزئیات بیشتر و خرید
🛡️ گارانتی ۳۶ ماهه آونگ!
با گارانتی معتبر، از سرعت و امنیت SSD خود لذت ببرید.
تصور کنید توی یه روز شلوغ کاری هستید...
لپتاپ رو باز میکنید، یه پروژهی بزرگ و حیاتی جلو روتونه، و باید هرچه سریعتر فایلهای سنگین رو منتقل کنید. حالا چی کار میکنید؟!
همینجاست که SSD اکسترنال ADATA مثل یه قهرمان وارد میشه:
سرعتش انقد بالاست که قبل از اینکه حتی یه لیوان چای بخورید، انتقال فایل تموم شده!
💎 کدوم مدل رو انتخاب میکنید؟
🔹 مدل SD810 – برای حرفهایها و عاشقان ماجراجویی!
سرعت تا 2000MB/s، مقاوم در برابر ضربه و سقوط، ضدآب و ضدگردوغبار
با استاندارد IP68
ایدهآل برای عکاسان و فیلمبرداران حرفهای
🔗 جزئیات بیشتر و خرید
🔹 مدل SD620 – مقرونبهصرفه برای همه نیازها!
سرعت تا 520MB/s، طراحی مقاوم، رنگهای متنوع، سازگار با دستگاههای مختلف
🔗 جزئیات بیشتر و خرید
🛡️ گارانتی ۳۶ ماهه آونگ!
با گارانتی معتبر، از سرعت و امنیت SSD خود لذت ببرید.
🌭43🤣25🍌12⚡3❤🔥1
شرکت OpenAI از دومین Agent خودش موسوم به Deep Research رونمایی کرده که از نظر کارکرد دقیقا مشابه قابلیت Deep Research در جمنای هست.
بدین صورت وقتی جوابی که از هوش مصنوعی بخواین دیگه یک جواب کوتاه، ساده و سریع نیست، این قابلیت رو روشن میکنین تا یک تحقیق کامل و با جزییات بالا برای شما تهیه کنه.
در نتیجه با فعال کردن اون، ChatGPT با استفاده از مدل O3 سایتها و مقالات مختلف رو مرور میکنه، به اطلاعاتی که بهشون در این پروسه برمیخوره واکنش نشون میده، مسیرش رو در صورت نیاز تغییر بده و این اطلاعات رو با استفاده از این مدل استلالی و همچنین ابزارهای مختلف پایتون، پردازش میکنه و در نهایت یک گزارش کامل در مورد موضوعات مختلف از جمله در حوزه های مالی، علم، سیاست، مهندسی و غیره تهیه میکنه.
علاوه بر اینها برای انجام تحقیقی با دقت بالا برای خرید محصولات گرون قیمتی همچون خونه، خودرو، وسایل منزل و غیره هم کاربردی هست.
در حال حاضر این قابلیت فقط خروجی متن به کاربر میده ولی OpenAI گفته در اینده این مدل میتونه در گزارشاتی که تهیه میکنه عکس، نمودار و دیگر خروجی های اماری رو هم اضافه کنه و همچنین به منابع مختلف داده و سایتهای با اشتراک پولی هم متصل بشه.
این قابلیت منابع زیادی نیاز داره و انجام هر تحقیق توسط اون بین 5 تا 30 دقیقه زمان میبره. در نتیجه Deep Research از امروز فقط در دسترس کاربران اشتراک 200 دلاری پرو هست و اونها هم فقط 50 تحقیق در ماه میتونن از اون بخوان.
در ماه اینده این قابلیت با تعداد محدودی در دسترس کاربران اشتراک پلاس قرار میگیره و در ماه بعد با تعداد بسیار محدودتر و با نسخه سبکتری، کاربران رایگان هم میتونن از اون استفاده کنن.
🔎 techcrunch
📍 @TechTube
بدین صورت وقتی جوابی که از هوش مصنوعی بخواین دیگه یک جواب کوتاه، ساده و سریع نیست، این قابلیت رو روشن میکنین تا یک تحقیق کامل و با جزییات بالا برای شما تهیه کنه.
در نتیجه با فعال کردن اون، ChatGPT با استفاده از مدل O3 سایتها و مقالات مختلف رو مرور میکنه، به اطلاعاتی که بهشون در این پروسه برمیخوره واکنش نشون میده، مسیرش رو در صورت نیاز تغییر بده و این اطلاعات رو با استفاده از این مدل استلالی و همچنین ابزارهای مختلف پایتون، پردازش میکنه و در نهایت یک گزارش کامل در مورد موضوعات مختلف از جمله در حوزه های مالی، علم، سیاست، مهندسی و غیره تهیه میکنه.
علاوه بر اینها برای انجام تحقیقی با دقت بالا برای خرید محصولات گرون قیمتی همچون خونه، خودرو، وسایل منزل و غیره هم کاربردی هست.
در حال حاضر این قابلیت فقط خروجی متن به کاربر میده ولی OpenAI گفته در اینده این مدل میتونه در گزارشاتی که تهیه میکنه عکس، نمودار و دیگر خروجی های اماری رو هم اضافه کنه و همچنین به منابع مختلف داده و سایتهای با اشتراک پولی هم متصل بشه.
این قابلیت منابع زیادی نیاز داره و انجام هر تحقیق توسط اون بین 5 تا 30 دقیقه زمان میبره. در نتیجه Deep Research از امروز فقط در دسترس کاربران اشتراک 200 دلاری پرو هست و اونها هم فقط 50 تحقیق در ماه میتونن از اون بخوان.
در ماه اینده این قابلیت با تعداد محدودی در دسترس کاربران اشتراک پلاس قرار میگیره و در ماه بعد با تعداد بسیار محدودتر و با نسخه سبکتری، کاربران رایگان هم میتونن از اون استفاده کنن.
🔎 techcrunch
📍 @TechTube
❤🔥49🌭24😁7🤣4⚡3🤬3🍌3
مهندسان OpenAI در ویدیوی معرفی قابلیت Deep Research یک بامزه بازی دراوردن و در یکی از چتهای گذشته ای که با ChatGPT داشتن از اون پرسیدن:
📍 @TechTube
ایا Deeper Seeker اسم خوبیه؟
📍 @TechTube
🤣98🌭44🍌6😴3⚡2
TechTube 𝕏 تک توب
شرکت OpenAI از دومین Agent خودش موسوم به Deep Research رونمایی کرده که از نظر کارکرد دقیقا مشابه قابلیت Deep Research در جمنای هست. بدین صورت وقتی جوابی که از هوش مصنوعی بخواین دیگه یک جواب کوتاه، ساده و سریع نیست، این قابلیت رو روشن میکنین تا یک تحقیق کامل…
This media is not supported in your browser
VIEW IN TELEGRAM
دانشجوها وقتی میفهمن که قابلیت Deep Research فقط برای اشتراک ChatGPT Pro عرضه شده
🔎 ai_for_success
📍 @TechTube
🔎 ai_for_success
📍 @TechTube
🤣194😁13😢5🐳3⚡1🤗1
Forwarded from gooyban🦆
YouTube
اجرای دیپسیک به شکل آفلاین روی کامپیوتر و گوشی | Deepseek با openwebu
در این ویدیو، به سراغ نصب و اجرای مدل متنباز و قدرتمند DeepSeek روی دستگاههای مختلف میرویم. هدف اصلی این ویدیو نشان دادن مزایای استفاده آفلاین از هوش مصنوعی و اهمیت حفظ حریم خصوصی با خود میزبانی (Self-Hosting) است.
📌لینکها:
🔗 وبسایت Ollama:
https://ollama.com/…
📌لینکها:
🔗 وبسایت Ollama:
https://ollama.com/…
📌در این ویدئو یاد میگیریم چطور مدلهای هوش مصنوعی کوچکتر شده (Knowledge distillation) مثل دیپسیک که اینهمه سروصدا کرده را روی کامپیوتر، رزبریپای، مک یا حتی گوشی موبایل خودمون به صورت کاملا آفلاین اجرا کنیم!
لینک ویدئوها:
🔳 لینک ویدئو از یوتیوب
🔳 آموزش استفاده از OpenWebUI
🔳 لینک ویدئوی نصب ollama از کانال ۴ راه کامپیوتر
🔳 ویدئوی جدید کانال ۴ راه کامپیوتر در مورد دیپسیک (اینجا اردشیر از LmStudio استفاده میکنه)
🔳 ویدئوی جادی در مورد Deepseek
🔳 آموزش نصب داکر 👩💻
📹 مجموعهویدئوهای سلفهوستینگ
=======================
لینک ابزارها:
🌐 Ollama
🌐 OpenwebUI
🌐 PocketPalAI 👩💻 GooglePlay 👩💻 AppStore
💙 Docker-compose
=======================
لینک کانالهای خوب برای اخبار به روز مربوط به هوش مصنوعی:
💙 @techtube اخبار تکنولوژی
💙 @aipulse24 اخبار تخصصی AI
@gooyban #selfhosting #ai
چندتا نکته:
۱) در این ویدئو بیشتر در مورد دیپسیک صحبت میکنیم ولی هدف اینه که یاد بگیریم این سبک مدلها را روی دستگاههای خودمون اجرا کنیم و کمی با این ابزارها کنجکاوی کنیم، Ollama یه ابزار فوقالعاده است و کلی کار میشه باهاش کرد. اگه کار باحالی باهاش کردید میتونید این پایین کامنت بذارید!
۲) اگه دوست دارید در مورد خود دیپسیک اطلاعات بیشتری داشته باشید ویدئوی جادی را ببینید.
۳) در ویدئو فقط در مورد اندروید صحبت میکنم ولی PocketPalAI برای iOS هم موجوده (لینکش را پایین گذاشتم)، برنامهنویسش هم ایرانیه😉
لینک ویدئوها:
=======================
لینک ابزارها:
=======================
لینک کانالهای خوب برای اخبار به روز مربوط به هوش مصنوعی:
@gooyban #selfhosting #ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤38👏5🌭5💯2
🔻این پست مخصوص همه کساییه که میتونن از راه دور کار کنن
💻آیا در مهارتهایی مثل عکاسی، ویرایش ویدئو، طراحی سایت، یا کارهای گرافیکی تخصص دارید و دورکاری میکنید؟ اسپانیا فرصتی ویژه برای شما دارد!
🚀با ویزای دیجیتال نومد اسپانیا، میتوانید بهعنوان یک دورکار یا فریلنسر حرفهای در این کشور زندگی و کار کنید. این برنامه برای افرادی است که میخواهند در یک کشور پیشرفته اروپایی اقامت داشته باشند و فعالیت شغلی خود را از راه دور ادامه دهند.
آیا شغل و مهارت شما برای این ویزا مناسب است؟ یا سؤالی درباره این برنامه دارید؟ فرم زیر را پر کنید تا کارشناسان سوگیموتو ویزا با شما تماس بگیرند و راهنماییتان کنند!
✍🏻فرم مشاوره و ارزیابی رایگان
@sugimotovisa
💻آیا در مهارتهایی مثل عکاسی، ویرایش ویدئو، طراحی سایت، یا کارهای گرافیکی تخصص دارید و دورکاری میکنید؟ اسپانیا فرصتی ویژه برای شما دارد!
🚀با ویزای دیجیتال نومد اسپانیا، میتوانید بهعنوان یک دورکار یا فریلنسر حرفهای در این کشور زندگی و کار کنید. این برنامه برای افرادی است که میخواهند در یک کشور پیشرفته اروپایی اقامت داشته باشند و فعالیت شغلی خود را از راه دور ادامه دهند.
آیا شغل و مهارت شما برای این ویزا مناسب است؟ یا سؤالی درباره این برنامه دارید؟ فرم زیر را پر کنید تا کارشناسان سوگیموتو ویزا با شما تماس بگیرند و راهنماییتان کنند!
✍🏻فرم مشاوره و ارزیابی رایگان
@sugimotovisa
🍌30🌭8🤬7⚡1❤🔥1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
ربات جدید تسلا که به ادعای این شرکت میتونه تاکسیهای خودران این شرکت موسوم به CyberCab رو به صورت اتوماتیک تمیز کنه.
به گفته تسلا
🔎 tesla
📍 @TechTube
به گفته تسلا
this robot sucks
🔎 tesla
📍 @TechTube
🤣72⚡16❤10🤯4🆒3🗿2👏1🥴1
دولت چین در واکنش به تعرفه 10 درصدی امریکا روی واردات تمام اقلام چینی، اعلام کرده که پرونده ای برای شرکتهای گوگل، انویدیا و اینتل باز میکنه تا اهرم فشاری علیه دونالد ترامپ در هنگام مذاکره با اون داشته باشه.
این پرونده روی رفتار انحصارطلبانه گوگل با سیستم عامل اندروید و زیانهایی که برای شرکتهای چینی از جمله اوپو و شیائومی داشته تمرکز داره و انویدیا هم به خاطر رفتار ضدرقابتی قرار هست پرونده ای داشته باشه. دلیل باز شدن پرونده برای اینتل هنوز مشخص نیست.
در صورت شکست مذاکرات با دونالد ترامپ، این پرونده ها ممکن هست جریمه چند میلیارد دلاری برای این شرکتها به همراه داشته باشن.
🔎 arstechnica
📍 @TechTube
این پرونده روی رفتار انحصارطلبانه گوگل با سیستم عامل اندروید و زیانهایی که برای شرکتهای چینی از جمله اوپو و شیائومی داشته تمرکز داره و انویدیا هم به خاطر رفتار ضدرقابتی قرار هست پرونده ای داشته باشه. دلیل باز شدن پرونده برای اینتل هنوز مشخص نیست.
در صورت شکست مذاکرات با دونالد ترامپ، این پرونده ها ممکن هست جریمه چند میلیارد دلاری برای این شرکتها به همراه داشته باشن.
🔎 arstechnica
📍 @TechTube
🤣113🔥33👏15🍌8❤5🌚2🌭2⚡1
Forwarded from TOBANK
This media is not supported in your browser
VIEW IN TELEGRAM
مشتریان عزیز اپلیکیشن توبانک
🎁برای تسهیلات ۲ درصدی فوری،آنلاین و بدون ضامن، همین حالا اقدام کنید🎁
🔴کسب اطلاعات بیشتر: ۲۳۹۵۰-۰۲۱
🔴دانلود اپلیکیشن: tobank.ir
_____
توبانک، شعبه مجازیِ بانک گردشگری
🔴 @tobank
🎁برای تسهیلات ۲ درصدی فوری،آنلاین و بدون ضامن، همین حالا اقدام کنید🎁
🔴کسب اطلاعات بیشتر: ۲۳۹۵۰-۰۲۱
🔴دانلود اپلیکیشن: tobank.ir
_____
توبانک، شعبه مجازیِ بانک گردشگری
🔴 @tobank
🍌20🌭3⚡2❤🔥1
شرکت لنوو از کیبوردهای بی سیم جدیدش رونمایی کرده که خود شارژ شونده هستن و نیازی به شارژ دستی ندارن. چطوری؟ با ترکیب سلولهای خورشیدی و ابرخازن!
این کیبورد به سلولهای خورشیدی مجهز شده که حتی با نور اتاق هم امکان تولید برق به اندازه کافی برای اون رو دارن. اما برق تولید شده به جای اینکه مثل بقیه کیبوردها در باتری لیتیوم یونی ذخیره بشه، در ابرخازنها ذخیره میشه که سرعت شارژ بسیار بالا، عمر طولانی و وزن بسیار پایین دارن و کیبوردی که همیشه در معرض شارژ شدن هست، اون رو به یک گزینه عالی بدل میکنه.
لنوو گفته حتی در محیط تاریک، این کیبورد با یک بار شارژ میتونه 45 روز شارژدهی داشته باشه و در صورت اتمام شارژ اون، فقط کافیه 2 دقیقه زیر نوری با شدت 300 Lux بمونه تا به طور کامل شارژ بشه!
این کیبورد که امکان اتصال به 3 دستگاه از طریق بلوتوث داره و در برابر ریزش مایعات مقاوم هست، با قیمت 69 دلار قابل خریده.
🔎 notebookcheck
📍 @TechTube
این کیبورد به سلولهای خورشیدی مجهز شده که حتی با نور اتاق هم امکان تولید برق به اندازه کافی برای اون رو دارن. اما برق تولید شده به جای اینکه مثل بقیه کیبوردها در باتری لیتیوم یونی ذخیره بشه، در ابرخازنها ذخیره میشه که سرعت شارژ بسیار بالا، عمر طولانی و وزن بسیار پایین دارن و کیبوردی که همیشه در معرض شارژ شدن هست، اون رو به یک گزینه عالی بدل میکنه.
لنوو گفته حتی در محیط تاریک، این کیبورد با یک بار شارژ میتونه 45 روز شارژدهی داشته باشه و در صورت اتمام شارژ اون، فقط کافیه 2 دقیقه زیر نوری با شدت 300 Lux بمونه تا به طور کامل شارژ بشه!
این کیبورد که امکان اتصال به 3 دستگاه از طریق بلوتوث داره و در برابر ریزش مایعات مقاوم هست، با قیمت 69 دلار قابل خریده.
🔎 notebookcheck
📍 @TechTube
1❤152🔥89❤🔥16⚡8👏3🌚2☃1🥴1🤝1
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥94😁33🤣15🌭7🤓4🗿4❤1⚡1
Forwarded from AI Pulse (Mohammad)
تشویق مدل به فکر کردن بیشتر، تنها با اضافه کردن Wait به دستور!
محققان دانشگاه استنفورد یک روش جدید برای بهینهسازی مدلهای زبانی معرفی کردن. این روش که s1 نام داره، با استفاده از فقط ۱۰۰۰ نمونه آموزشی و یک تکنیک ساده به نام budget forcing تونسته عملکردی مشابه مدلهای بزرگ OpenAI مثل o1 به دست بیاره. نکته مهم اینجاست که اکثر مدلهای موفق در این حوزه مثل DeepSeek r1 از دادههای آموزشی خیلی بیشتری (حدود ۸۰۰ برابر) استفاده میکنن.
محققان استنفورد برای انتخاب این ۱۰۰۰ نمونه از سه معیار اصلی استفاده کردن: کیفیت (دادههای با فرمت مناسب و بدون خطا)، سختی (مسائلی که مدلهای پایه نمیتونن حل کنن) و تنوع (پوشش حوزههای مختلف از ریاضیات تا فیزیک و علوم کامپیوتر). این انتخاب هوشمندانه باعث شده که با وجود حجم کم دادههای آموزشی، مدل بتونه عملکرد خوبی داشته باشه.
تکنیک budget forcing که در این تحقیق معرفی شده، یک روش ساده اما موثر برای کنترل زمان فکر کردن مدل هست. این تکنیک به دو روش عمل میکنه: اول اینکه اگر مدل بیش از حد مشخصی فکر کنه، به طور خودکار پردازش متوقف میشه و مدل مجبور به ارائه پاسخ میشه. دوم اینکه اگر بخوایم مدل بیشتر فکر کنه، با اضافه کردن کلمه "Wait" به زنجیره استدلال، مدل تشویق میشه تا بیشتر روی مسئله تمرکز کنه.
در آزمونهای مختلف، مدل s1-32B عملکرد قابل توجهی داشته. برای مثال در آزمونهای ریاضی AIME24 به دقت ۵۶.۷ درصد و در MATH500 به دقت ۹۳ درصد رسیده. همچنین در سوالات علمی سطح دکترا (GPQA Diamond) به دقت ۵۹.۶ درصد دست پیدا کرده که نشون میده این مدل میتونه با مدلهای بزرگتر رقابت کنه.
نکته جالب دیگه اینه که کل فرآیند آموزش این مدل فقط ۲۶ دقیقه روی ۱۶ کارت H100 طول کشیده که در مقایسه با مدلهای مشابه که نیاز به روزها و هفتهها آموزش دارن، بسیار کمتره. این نشون میده که با روشهای هوشمندانه میشه به جای افزایش حجم داده و زمان محاسبات، به نتایج مشابه یا حتی بهتری رسید.
محققان همچنین نشون دادن که با افزایش زمان فکر کردن مدل در زمان استفاده (test-time)، دقت پاسخها بهبود پیدا میکنه. برای مثال در AIME24، وقتی به مدل اجازه داده شد تا ۶ بار بیشتر فکر کنه، دقت از ۵۰ درصد به ۵۷ درصد افزایش پیدا کرد. این نشون میده که حتی بعد از آموزش هم میشه با تنظیم پارامترهای اجرا، عملکرد مدل رو بهبود داد.
نسخه کامل این مقاله رو میتونید از اینجا مشاهده کنید.
@aipulse24
محققان دانشگاه استنفورد یک روش جدید برای بهینهسازی مدلهای زبانی معرفی کردن. این روش که s1 نام داره، با استفاده از فقط ۱۰۰۰ نمونه آموزشی و یک تکنیک ساده به نام budget forcing تونسته عملکردی مشابه مدلهای بزرگ OpenAI مثل o1 به دست بیاره. نکته مهم اینجاست که اکثر مدلهای موفق در این حوزه مثل DeepSeek r1 از دادههای آموزشی خیلی بیشتری (حدود ۸۰۰ برابر) استفاده میکنن.
محققان استنفورد برای انتخاب این ۱۰۰۰ نمونه از سه معیار اصلی استفاده کردن: کیفیت (دادههای با فرمت مناسب و بدون خطا)، سختی (مسائلی که مدلهای پایه نمیتونن حل کنن) و تنوع (پوشش حوزههای مختلف از ریاضیات تا فیزیک و علوم کامپیوتر). این انتخاب هوشمندانه باعث شده که با وجود حجم کم دادههای آموزشی، مدل بتونه عملکرد خوبی داشته باشه.
تکنیک budget forcing که در این تحقیق معرفی شده، یک روش ساده اما موثر برای کنترل زمان فکر کردن مدل هست. این تکنیک به دو روش عمل میکنه: اول اینکه اگر مدل بیش از حد مشخصی فکر کنه، به طور خودکار پردازش متوقف میشه و مدل مجبور به ارائه پاسخ میشه. دوم اینکه اگر بخوایم مدل بیشتر فکر کنه، با اضافه کردن کلمه "Wait" به زنجیره استدلال، مدل تشویق میشه تا بیشتر روی مسئله تمرکز کنه.
در آزمونهای مختلف، مدل s1-32B عملکرد قابل توجهی داشته. برای مثال در آزمونهای ریاضی AIME24 به دقت ۵۶.۷ درصد و در MATH500 به دقت ۹۳ درصد رسیده. همچنین در سوالات علمی سطح دکترا (GPQA Diamond) به دقت ۵۹.۶ درصد دست پیدا کرده که نشون میده این مدل میتونه با مدلهای بزرگتر رقابت کنه.
نکته جالب دیگه اینه که کل فرآیند آموزش این مدل فقط ۲۶ دقیقه روی ۱۶ کارت H100 طول کشیده که در مقایسه با مدلهای مشابه که نیاز به روزها و هفتهها آموزش دارن، بسیار کمتره. این نشون میده که با روشهای هوشمندانه میشه به جای افزایش حجم داده و زمان محاسبات، به نتایج مشابه یا حتی بهتری رسید.
محققان همچنین نشون دادن که با افزایش زمان فکر کردن مدل در زمان استفاده (test-time)، دقت پاسخها بهبود پیدا میکنه. برای مثال در AIME24، وقتی به مدل اجازه داده شد تا ۶ بار بیشتر فکر کنه، دقت از ۵۰ درصد به ۵۷ درصد افزایش پیدا کرد. این نشون میده که حتی بعد از آموزش هم میشه با تنظیم پارامترهای اجرا، عملکرد مدل رو بهبود داد.
نسخه کامل این مقاله رو میتونید از اینجا مشاهده کنید.
@aipulse24
1💯45👏28❤16❤🔥3⚡2🔥2💋1