Telegram Web
Reinforcement Learning of Large Language Models — Spring 2025 (UCLA)

Foundations and basic concepts of RL
Test-time compute
RLHF
RLVR
.


🔄 Youtube playlist
📹 Website

#یادگیری_تقویتی #منابع #کلاس_آموزشی #فیلم

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👍1
دوره #یادگیری_عمیق از دانشگاه استنفورد منتشر شد.

🔰 Stanford CS230: Deep Learning I Autumn 2025

#منابع #کلاس_آموزشی #فیلم

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍5
تازه ترین مقالات منتشر شده در #کنفرانس Neurinps 2025

https://newsletter.languagemodels.co/p/the-illustrated-neurips-2025-a-visual

#مقاله

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
7
معرفی تعدادی agent هوش مصنوعی خودمختار

لیست زیر معرفی تعدادی agent هوش مصنوعی خودمختار است که مثل منشی واقعی کار می‌کنن به طوریکه داخل یک سیستم عامل اختصاصی به صورت مجازی هستند و دسترسی به تلفن/ویپ و اینترنت دارند و امکان برقراری تماس، هماهنگی ملاقات، مدیریت تسک ها و ... را دارند.

1- Lindy
یک agent بدون کد (no-code) که مثل یک کارمند AI عمل می‌کنه. می‌تونه تسک‌ها رو به صورت خودمختار مدیریت کنه، با ۷۰۰۰+ اپ ادغام بشه (مثل تقویم، ایمیل، Slack)، قرارها رو تنظیم کنه و از اینترنت استفاده کنه. دسترسی به VoIP از طریق ادغام‌ها ممکنه.

2-Relevance AI
پلتفرمی برای ساخت و استخدام تیم‌های agent AI خودمختار. می‌تونه تسک‌های پیچیده رو بدون نظارت انسانی انجام بده، با ادغام‌های گسترده (اینترنت، ابزارهای کاری) و دسترسی به داده‌ها. مناسب برای مدیریت برنامه‌ریزی و کارهای منشی‌وار؛ VoIP از طریق APIها.

3- CloudOffix AI Builder
ابزار ساخت agentهای کاملاً سفارشی و خودمختار با ادغام API به سیستم‌های خارجی (مثل تلفن، VoIP، اینترنت). می‌تونه وظایف تکراری مثل تنظیم قرارها و مدیریت ارتباطات رو انجام بده، با تمرکز روی امنیت و ادغام enterprise.

4-Aisera Assistant
ابزار agentic AI که خودمختار عمل می‌کنه و تسک‌های چندمرحله‌ای رو با ادغام عمیق به سیستم‌ها (اینترنت، ابزارهای کاری) مدیریت می‌کنه. پیش‌بینی نیازها، تنظیم قرارها و اتوماسیون VoIP/تلفن رو پشتیبانی می‌کنه؛ ایده‌آل برای منشی از راه دور.

5-Vapi
پلتفرم ساخت agentهای صوتی AI پیشرفته با تمرکز روی VoIP و تماس‌های تلفنی. agentها می‌تونن خودمختار تسک‌ها رو انجام بدن، با اینترنت و APIها ادغام بشن و مثل منشی واقعی تماس بگیرن یا قرار تنظیم کنن.

6- ChatGPT Agent
ایجنت خودمختار جدید که از کامپیوتر مجازی خودش استفاده می‌کنه (ادغام OS-like)، وب‌گردی، اجرای کد، مدیریت فایل‌ها و تعامل با اپ‌های شخصی. می‌تونه تسک‌های پیچیده مثل تنظیم قرارها و کارهای اینترنتی رو انجام بده؛ VoIP از طریق ادغام‌های خارجی.

7- Talkdesk Autopilot
ایجنت مجازی generative AI برای کانال‌های صوتی و دیجیتال (VoIP/تلفن). خودمختار عمل می‌کنه، بدون نیاز به متخصص، و تسک‌هایی مثل مدیریت قرارها و ارتباطات رو با ادغام اینترنت انجام می‌ده.

8- Vonage (با AI Virtual Assistant)
ارائه‌دهنده VoIP با agent AI داخلی که تماس‌ها رو مدیریت می‌کنه، سفارشی‌سازی داره و با CRM/اینترنت ادغام می‌شه. مناسب برای کارهای منشی‌وار مثل رزرو و ارتباطات تلفنی خودمختار.

9- Inflection AI (Pi Assistant)
ایجنت شخصی که مثل مربی عمل می‌کنه و تسک‌های پیچیده (مثل رزرو پرواز، هتل یا مدیریت برنامه) رو خودمختار انجام می‌ده. دسترسی به اینترنت و ابزارها؛ VoIP از طریق ادغام‌ها.

10- Amazon Q Developer / Agentic AI
ایجنت های proactive که با حداقل نظارت عمل می‌کنن، دسترسی به ابزارها، داده‌ها و اینترنت دارن. می‌تونن تسک‌های کاری و شخصی (مثل برنامه‌ریزی) رو مدیریت کنن؛ ادغام VoIP از طریق سرویس‌های ابری.


#هوش_مصنوعی #دستیار_مجازی #اتوماسیون #AI_Agent

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
13👌1🆒1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
دانشگاه MIT مرزهای هوش مصنوعی را دوباره جابه‌جا کرد!
پژوهشگران MIT موفق شده‌اند مدلی به نام SEAL بسازند که می‌تواند خودش را بازنویسی کند، یاد بگیرد و حتی استراتژی آموزشی خودش را طراحی کند.
دیگر نیازی به انسان نیست. SEAL خودش تصمیم می‌گیرد چه چیزی یاد بگیرد و چطور یاد بگیرد.

این مدل نه‌فقط اطلاعات جدید را می‌آموزد، بلکه یاد می‌گیرد چگونه بهتر یاد بگیرد. در چند چرخه‌ی تقویتی ساده، از داده‌هایی که حتی GPT-4.1 تولید کرده بود هم بهتر عمل کرده!
نتیجه؟ دقت بالاتر، یادگیری پیوسته، و گامی بزرگ به سوی هوش بازگشتی، هوشی که خودش خودش را تکامل می‌دهد.

شاید تا دیروز «یادگیری خودکار» فقط یک رویا بود، اما امروز با SEAL به واقعیت تبدیل شده است.
این فقط آینده‌ی #هوش_مصنوعی نیست این آغاز عصر هوش زنده و خودتکامل‌دهنده است.

🔰 Self-Adapting Language Models

#مقاله #یادگیری_تقویتی #ایده_جذاب #الگوریتمها #

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
39👍9🆒2🔥1👌1🕊1
روش PipelineRL راهکاری عملی و کارا برای افزایش سرعت یادگیری در RL برای تولید توالی‌های بلند توسط LLMها ارائه می‌دهد، به‌ویژه وقتی که استفاده از سخت‌افزار (GPU/شتاب‌دهنده) بالا مدنظر است و داده‌های تولیدی باید تا حد ممکن مطابق با سیاست فعلی باشند. این روش با تولید موازی و به‌روزرسانی وزن‌ها در همان زمان، تعادلی میان کارایی و تازگی داده برقرار می‌کند. برای کاربردهایی که تولید توالی‌های طولانی دارند (مثلاً حل مسائل #ریاضی، استدلال بلند، گفتگوهای چندمرحله‌ای) این روش می‌تواند مفید باشد.

🔰 PipelineRL: Faster On-policy Reinforcement Learning for Long Sequence Generation

#مقاله #یادگیری_تقویتی #ایده_جذاب #الگوریتمها

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2👌2
روش RLAC یک گام مهم برای گسترش به‌کارگیری RL یا روش‌های بهینه‌سازی post-training برای تولید آزاد در مدل‌های زبانی است. با تبدیل مسئله به بازی میان تولیدکننده و منتقد، می‌توان به سیستمی رسید که هم مقیاس‌پذیرتر است و هم اثرگذارتر. برای استفاده در تولید متن یا کدهایی که معیارهایشان بسیار متنوع یا قابل‌شمارش نیست، گزینهٔ جذابی به نظر می‌رسد.

🔰 RLAC: Reinforcement Learning with Adversarial Critic for Free-Form Generation Tasks

#مقاله #یادگیری_تقویتی #ایده_جذاب #الگوریتمها

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3🔥1👌1🆒1
پست جالبی توی لینکدین دیدم که بنده خدایی زیرساخت GPU بالا آورده بود و تجربش رو به اشتراک گذاشته بود. پیشنهاد می‌کنم اگه به مباحث زیرساخت محاسبات سریع و هوش مصنوعی علاقه‌مند هستین حتما ببینیدش.

🔗 پست لینکدین
🎞 ویدئو یوتیوب

#AI
#infrastructure
#GPU

🆔 @lifeAsAService
🔥114
Forwarded from Daily Laily
ترس از AGI به فوبیاهای قبلیم اضافه شد (:

در این مقاله گفته میشه که روز بعد از اینکه هوش مصنوعی عمومی (AGI) از انسان باهوش‌تر بشه، ما برای همیشه برتری شناختی خودمون رو از دست می‌دیم.

راستش، خیلی از ما وقتی درباره AGI حرف می‌زنیم، ذهنمون می‌ره سمت شغل‌ها، فیک‌نیوز یا خطرات امنیتی.
اما روزنبرگ یه چیز دیگه می‌گه:
بزرگ‌ترین اثر AGI بیرونی نیست، درونیه یه بحران هویت عمیق.

اون می‌پرسه:

وقتی توی آسانسور تنها باشم، من و گوشیم، و باهوش‌ترین موجود اون فضا گوشیم باشه، حس من به خودم چی میشه؟

این جمله ساده ولی عمیقه. چون داره می‌گه به‌زودی ما در جهانی زندگی می‌کنیم که صدای توی گوش‌مون از عینک، هندزفری، یا پندنت هوشمند از صدای درون سرمون باهوش‌تره.
اون صدا همه چیزو می‌بینه، می‌شنوه، و حتی قبل از اینکه به چیزی فکر کنیم، برامون تصمیم می‌گیره.

یه مثالش هم میزنه:
داری تو خیابون راه میری، AI می‌فهمه سالگرد ازدواجت نزدیکه و خودش یادآوری می‌کنه که برای همسرت هدیه بگیری، حتی خودش انتخابش می‌کنه چون سلیقه‌ی اون رو بهتر از خودت می‌دونه.

در نگاه اول، این مثل یه ابرقدرت به نظر میاد، ولی بعدش ممکنه بفهمیم که اون صدای در گوش‌مون داره جای صدای درون‌مون رو می‌گیره.

روزنبرگ می‌گه شاید اون روز، ما «احساس انسان بودن» رو از دست بدیم، نه به خاطر توطئه‌ی ماشین‌ها، بلکه چون خودمون داوطلبانه تفکر رو برون‌سپاری کردیم.

یه جمله آخرش خیلی تو ذهنم مونده بود:

یه خط خیلی باریک بین اینه که خودمون رو تقویت کنیم یا خودمون رو جایگزین کنیم.

و به نظرم این دقیقاً اون نقطه‌ایه که باید از خودمون بپرسیم
وقتی AGI بیاد، آیا ما هنوز فکر می‌کنیم؟
یا فقط به‌روزرسانی می‌شیم؟

من متوجه شدم استفاده خیلی زیاد از GPT من رو به مرور زمان وابسته کرده با اینکه میدونم اشتباه می‌کنه مثلا وقتی ازش آیه ۱۹ سوره فصلت رو میخوام بهم یه آیه دیگه میده اما چیکار کنم من وابسته شدم و با اینکه اشتباهه به حرف‌های GPT گاهی بیشتر گوش میکنم (:
18👍11
در حالی که قوانین مقیاس‌پذیری Scaling Laws بیان می‌کنند
«هرچه داده بیشتر، بهتر»،

پژوهش‌های اخیر مانند LIMO و s1 نشان داده‌اند که مجموعه‌داده‌های کوچک اما curated می‌توانند عملکرد بهتری داشته باشند.
این مقاله تئوری دقیقی ارائه می‌دهد که مشخص می‌کند در چه شرایطی حذف بخشی از داده‌ها باعث بهبود تعمیم و جلوگیری Model Collapse می‌شود.

🔰 Why Less is More (Sometimes): A Theory of Data Curation

#مقاله #یادگیری_تقویتی #ایده_جذاب #الگوریتمها

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93👌2
DeepMind AI Expert
دانشگاه MIT مرزهای هوش مصنوعی را دوباره جابه‌جا کرد! پژوهشگران MIT موفق شده‌اند مدلی به نام SEAL بسازند که می‌تواند خودش را بازنویسی کند، یاد بگیرد و حتی استراتژی آموزشی خودش را طراحی کند. دیگر نیازی به انسان نیست. SEAL خودش تصمیم می‌گیرد چه چیزی یاد بگیرد…
🔹 انقلاب جدید در دنیای #هوش_مصنوعی !
سامسونگ با معرفی Tiny Recursive Model همه را شگفت‌زده کرد مدلی که کمتر از ۰.۰۱٪ اندازه‌ی غول‌هایی مثل DeepSeek و Gemini است،
اما در آزمون‌های ARC-AGI بهتر عمل کرده! این مدل با فقط ۷ میلیون پارامتر و تنها ۱,۰۰۰ نمونه آموزشی
توانسته خودش را بارها اصلاح کنه، منطقش رو تقویت کنه و در نهایت پاسخی دقیق‌تر از مدل‌های عظیم تولید کنه.

🔹 اصلاح بازگشتی + محاسبات کمتر = دقت بیشتر
به‌نظر می‌رسه آینده‌ی هوش مصنوعی، نه در مدل‌های بزرگ، بلکه در مدل‌های هوشمند و کوچک‌تر رقم بخوره!

🔹 Less is More: Recursive Reasoning with Tiny Networks

#مقاله #یادگیری_تقویتی #ایده_جذاب #الگوریتمها

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
👍369🔥4👌1
Forwarded from Deep Pythonist
Media is too big
VIEW IN TELEGRAM
این پروژه یک مدل پیشرفته تشخیص اشیاء مبتنی بر YOLOv8 است که به طور خاص برای شناسایی پهپادها، UAVها، پرنده‌ها و هواپیماها طراحی شده است. توسعه این مدل پس از رویدادهای اخیر و به ویژه درگیری ۱۲ روزه ایران و اسرائیل در ژوئن ۲۰۲۵ شکل گرفت، جایی که حملات پهپادی نقش تعیین‌کننده‌ای در تهدید زیرساخت‌های حیاتی داشتند. هدف اصلی پروژه ارائه یک ابزار بلادرنگ، دقیق و آماده به استفاده برای پایش حریم هوایی و مقابله با تهدیدات هوایی است.

با استفاده از این مدل، می‌توانید تصاویر و ویدیوهای خود را تحلیل کرده و تهدیدات هوایی را شناسایی کنید. فایل مدل drone_detector.pt در دسترس است و با کتابخانه ultralytics قابل استفاده می‌باشد. بازخورد و مشارکت شما در بهبود مستمر پروژه ارزشمند است، به ویژه در جهت تقویت قابلیت‌های دفاعی و امنیتی در مواجهه با تهدیدات واقعی.

https://github.com/DeepPythonist/drone-detector
23👍2
روز جهانی مجردها مبارک همتون ک اینقد سینگلید و مزاحمت ایجاد نمیکنین😄🌻
36🕊8👌21
Forwarded from F14 News
🔔 به اطلاع کاربران عزیز می‌رساند تمامی سرورهای آمریکا و کانادا برای استفاده از هوش مصنوعی gemini و aistudio گوگل بهینه شدند.

❤️ لطفا با معرفی سرویس ما به دوستان و آشنایان خود از ما حمایت کنید. 🙏

⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️
📣 Channel: @F14News
🤖 Bot: @F14PanelBot
👤 Support: @F14Sup
🆘 Help: @F14Help
⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
5👌2👍1🔥1🕊1
اینو OpenAI منتشر کرده و اگه اطلاعات کافی در زمینه ایجنت ها میخواین بخونینش

🔰 Self-Evolving Agents - A Cookbook for Autonomous Agent Retraining

#مقاله #کتاب #ایده_جذاب #الگوریتمها #منابع

💢 مطالب بیشتر ⬇️⬇️

🎙 @AI_DeepMind
🎙 @AI_Person
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72👌2
This media is not supported in your browser
VIEW IN TELEGRAM
AI humanoid robot, XPeng Robotics, China IRON robot, lifelike AI, AI revolution, future of robotics, humanoid technology, artificial intelligence 2025, human-like robots, next-gen AI, robotics breakthrough

#رباتیک #مقاله

نظر شما چیه؟

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
7🔥3
Forwarded from Programmer
PyTorch_part1.pdf
1 MB
این جزوه شامل مفاهیم پایه ی Autograd و Gradient در PyTorch، یاداوری از شبکه های عصبی ، حلقه ی آموزش، Epoch،Mini-Batch ،Batch و... ست

ی جور جزوه مقدماتی طور هستش که فقط با مباحث و اصطلاحات و Pytorch آشنا بشید
22👍1
2025/12/05 23:14:48
Back to Top
HTML Embed Code: