Telegram Web
Forwarded from آموزش LLM و VLM
Media is too big
VIEW IN TELEGRAM
🎓 مینی دوره: ساخت هوش مصنوعی شخصی در مرورگر

https://mktb.me/5kkw/

تو این مینی دوره یاد می‌گیری چطور یک Local LLM و حتی VLM رو مستقیم تو مرورگر اجرا و شخصی‌سازی کنی—بدون نیاز به سرور، پردازش ابری، فریم‌ورک یا لایبری اضافی!

💡 آنچه یاد می‌گیرید:

- اصول پایه‌ای جاوااسکریپت برای کار با مدل‌های AI در مرورگر
- کار با Prompt API برای مدیریت و کنترل پاسخ‌های مدل
- شخصی‌سازی خروجی با Initial Prompts و JSON Schema
- پیاده‌سازی VLM برای تحلیل تصاویر و OCR

📌 سرفصل‌ها:

راه اندازی Local LLM در مرورگر

شروع کار با Prompt API

نکات تکمیلی Prompt API

استفاده از Prompt Streaming یا پاسخ‌دهی هم‌زمان Local LLM

متوقف کردن پاسخ‌دهی  Local LLM با Aborting

پاک کردن حافظه Local LLM

اختصاصی‌سازی خروجی با Initial Prompts

اختصاصی‌سازی خروجی با JSON Schema

پیاده‌سازی VLM یا تحلیل تصاویر در Google Chrome

سایر APIها و راهنمای ادامه مسیر

🚀 آماده‌ای مهارتت در ساخت هوش مصنوعی شخصی رو یک پله بالاتر ببری؟

https://mktb.me/5kkw/


کد تخفیف 60 درصدی ویژه انتشار مینی دوره:


COUPON-35715


سایت دوره:
https://jsai.ir/
9👍1
دنیایی از منابع برنامه‌نویسی توی این کانال بصورت دسته‌بندی شده با هشتگ بصورت روزانه قرار داده میشه.

@pythony
👍6🔥1
Forwarded from آموزش LLM و VLM
یه نفر رفته system prompt‌های پشت‌پردهٔ کلی ابزار و چت‌بات معروف رو از طریق یه leak بزرگ پیدا کرده و همشو منتشر کرده!
الان یک ریپو تو گیت‌هاب هست که عملاً تبدیل شده به آرشیوی از مغزِ واقعی ابزارهای هوش مصنوعی — از Cursor و Devin گرفته تا Claude، Replit، Perplexity و ده‌ها ابزار دیگه.
اگه می‌خواید ببینید این ابزارها پشت صحنه چه قوانین، چه نقش‌ها و چه پرامپت‌هایی دارن، این ریپو واقعاً مثل گنج می‌مونه.
حتی می‌تونید برای طراحی agent یا پرامپت‌هاتون ازش ایده بگیرید.


https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools
👏13🔥61
Forwarded from آموزش LLM و VLM
تشخیص اشیا با Qwen3-VL به روش open vocabulary!

پرامپت: «person between albert and marie»
(فرد بین آلبرت و ماری)

مدل باید نام‌های «albert» و «marie» را در این عکس به آلبرت اینشتین و ماری کوری نگاشت کند، چهره‌ها و جایگاه آن‌ها را تشخیص دهد و مفهوم «بین» را درست تفسیر کند تا فرد صحیح را پیدا کند.

کتابخانه Supervision از گروه roboflow کار با مدل‌های چندوجهی (VLMها) را به این منظور ساده‌تر می‌کند. شما متن را پردازش می‌کنید، آن را به یک فرمت آشنا مثل باکس‌های تشخیص تبدیل می‌کنید و نتیجه را به‌صورت بصری نمایش می‌دهید.

TARGET = "person between albert and marie"

image = Image.open(IMAGE).convert("RGB")
response = qwen_detect(image, TARGET)

detections = sv.Detections.from_vlm(
vlm=sv.VLM.QWEN_3_VL,
result=response,
resolution_wh=image.size
)



کتابخانه Supervision از مدل‌های دیگر مثل Qwen-VL، Google Gemini و DeepSeek-VL و ... پشتیبانی می‌کند.

نوت بوک:

https://github.com/Alireza-Akhavan/LLM/blob/main/open_vocabulary_object_detection_with_qwen3_vl.ipynb

همین امروز یادگیری VLM را شروع کنید.
10👍7🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
https://www.alphaxiv.org/

اگه زیاد با مقالات علمی سروکار داری، این ابزار واقعاً به کارت میاد:

⭐️ افزونه کروم هم داره
⭐️ هر بخش از مقاله رو فقط هایلایت کن، همون‌جا ازش سؤال بپرس
⭐️ با نوشتن “@” می‌تونی سریع به مقالات دیگه ارجاع بدی و کانتکست، مقایسه‌ها و نتایج بنچمارک رو یکجا ببینی
⭐️ پشتیبانی از زبان فارسی هم داره!
⭐️ میتونی LLM پشتشو خودت انتخاب کنی که الان از Gemini 3 pro هم ساپورت میکنه
👍164
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 شرکت Meta فقط SAM 3 را معرفی نکرد، بلکه SAM 3D را هم منتشر کرد!

مدل جدید Meta یک جهش بزرگ در بازسازی سه‌بعدی از روی تصاویر دوبعدی ایجاد کرده است؛ هم برای اشیا و هم برای بدن انسان.

🔹 SAM 3D Objects
این نسخه می‌تواند فقط از روی یک تصویر، کل ساختار سه‌بعدی یک شیء شامل شکل، هندسه، بافت (Texture) و چیدمان آن را بازسازی کند.
فرآیند آن دو مرحله‌ای است:
ابتدا یک مدل Transformer ترکیبی ساختار کلی را تخمین می‌زند، سپس یک مدل دوم جزئیات دقیق و تکسچر را اضافه می‌کند.

🔹 SAM 3D Body
این نسخه مخصوص بازسازی مدل سه‌بعدی کامل بدن انسان از روی یک عکس است.
قابلیت گرفتن پرامپت‌های کمکی مثل نقاط کلیدی (Keypoints) و ماسک را دارد، مشابه SAM.
برای آموزش هم از داده‌های باکیفیت و یک سیستم برچسب‌گذاری هوشمند روی سخت‌ترین نمونه‌ها استفاده شده.

🔗 لینک‌ها:
📌 دموی رسمی:
https://aidemos.meta.com/segment-anything
📌 مخزن SAM 3D Objects:
https://github.com/facebookresearch/sam-3d-objects
📌 مخزن SAM 3D Body:
https://github.com/facebookresearch/sam-3d-body


شرکت Meta همه چیز را کاملاً متن‌باز منتشر کرده: وزن‌ها، داده‌ها و کد.

#sam3
🔥234👍3
This media is not supported in your browser
VIEW IN TELEGRAM
📢 مدل Nano Banana Pro معرفی شد 📢

🔥 مدل Nano Banana Pro یا همان Gemini 3 Pro Image جدیدترین مدل تصویری Google/DeepMind است که روی تولید و ویرایش تصویر با کیفیت بالا و کنترل‌پذیری دقیق تمرکز دارد. این مدل در درک صحنه و رندر جزئیات یک جهش جدی داشته.

🧠 یکی از نکات برجستهٔ آن، رندر متن داخل تصویر بدون distortion یا بهم‌ریختگی است. برای ساخت پوسترهای حرفه‌ای، نمودارها و صفحات محصول. همچنین امکان کنترل دقیق روی lighting، camera angle، scene setup و style را فراهم می‌کند.

🔗 جزئیات بیشتر در DeepMind 🔗

🌀 @cvision 🌀
🔥126👍4
دوستان عزیز،
یک فرد نابینا و بسیار توانمند که دانشجوی دکتری مهندسی عمران هستند، قصد یادگیری یادگیری ماشین را برای پایان نامه خودشون دارند و به همین منظور به یک مدرس خصوصی نیاز دارند و هزینه هم پرداخت می کنند .
اگر توانایی تدریس یادگیری ماشین را دارید یا فرد مناسبی را می‌شناسید، لطفاً از طریق @hassanYOUSEFZADE رزومه ی خودتون رو بفرستین .با تشکر
50👍4🔥3👏2
🎁🎊🎉به بهانه بلک فرایدی
برای همراهان کانال 👇

🎓 دوره جامع LLM
با تخفیف ۷۰٪ واقعی
🎟 بلیط ورود به دنیای مدل‌های زبانی بزرگ 🚀

کد تخفیف: COUPON-fa527
فقط برای مدت محدود - تا 10 آذرماه
https://mktb.me/04dr/
++++++++++++++++++
🎓 دوره جامع VLM – مدل‌های زبانی-تصویری

با تخفیف ۷۰٪ واقعی
🎟 ورود به دنیای مولتی‌مودال و AI ترکیبی 🚀

کد تخفیف: COUPON-0db40
فقط برای مدت محدود – تا 10 آذرماه
https://mktb.me/e3gx/
++++++++++++++++++

🎓 دوره جامع دیپ‌لرنینگ با TensorFlow
با تخفیف ۷۰٪ واقعی
🎟 یادگیری عملی شبکه‌های عصبی و پروژه‌های AI 🚀
کد تخفیف: COUPON-dc646
فقط برای مدت محدود – تا 10 آذرماه
https://mktb.me/2klm/
8👍2
۵۱٪ از ترافیک اینترنت امروز توسط ربات‌های هوش مصنوعی و پروفایل‌های مبتنی بر LLM تولید می‌شود و انسان‌ها فقط ۴۹٪ از تولید محتوای اینترنتی را انجام می‌دهند.

وقتی محتوا توسط هوش مصنوعی تولید می‌شود و دوباره همان محتوا خوراک مدل‌های جدید هوش مصنوعی می‌شود، وب به‌تدریج به یک اکوسیستم بسته و خودتکرارشونده میان ربات ها تبدیل می‌شود؛

یک Echo chamber عظیم که اصالت، خلاقیت و حتی واقعیت را تهدید می‌کند.

imperva.com/resources/resource-library/reports/2025-bad-bot-report
👌22👍8🤯61
🔔 به درخواست کاربران، علاوه بر تخفیف‌های قبلی بلک‌فرایدی:

🎓 دوره جامع OpenCV با پایتون
یک دوره کامل، پروژه‌محور و بسیار محبوب بین کاربرها
با تخفیف ۷۰٪ واقعی
کد تخفیف: COUPON-7f28f
🔗 https://mktb.me/81nt/

🎓 دوره شبکه‌های عصبی گرافی (GNN) – Class.Vision
برای علاقه‌مندان به هوش مصنوعی پیشرفته و گراف لرنینگ
با تخفیف ۵۰٪
کد تخفیف: blackfriday
🔗 https://class.vision/product/graph-neural-network/
8
دانشگاه استنفورد سامانه‌ای برای داوری و فیدبک رایگان سریع و خودکار روی مقالات علمی با کمک هوش مصنوعی راه اندازی کرده

https://paperreview.ai/
36👍4🤔3👀1
Tensorflow(@CVision)
🔥 شرکت Meta فقط SAM 3 را معرفی نکرد، بلکه SAM 3D را هم منتشر کرد! مدل جدید Meta یک جهش بزرگ در بازسازی سه‌بعدی از روی تصاویر دوبعدی ایجاد کرده است؛ هم برای اشیا و هم برای بدن انسان. 🔹 SAM 3D Objects این نسخه می‌تواند فقط از روی یک تصویر، کل ساختار سه‌بعدی…
This media is not supported in your browser
VIEW IN TELEGRAM
قبلاً در مورد SAM 3 و نسخه‌های سه‌بعدی مثل SAM 3D Objects و SAM 3D Body بحث کردیم...
متا یک قدم جلوتر رفته و استاندارد جدیدی در بین مدل‌های بینایی کامپیوتری ساخته:

قابلیت Segment Anything with Concepts!

نسخه‌ی جدید SAM 3 نه فقط اشیاء رو تشخیص می‌ده، بلکه با پرامپت مفهومی می‌تونی هر چیزی رو با یک عبارت ساده بخش‌بندی کنی؛ از «اتوبوس مدرسه زرد» گرفته تا «بازیکنی با لباس سفید».


مدل می‌تونه بین مفاهیم نزدیک خیلی دقیق تمایز بذاره—حتی در ویدیوهای شلوغ!
این کار با معماری جدید Presence Head انجام می‌شه

زیرساخت مدل:

دیتاست عظیم شامل ۴ میلیون مفهوم

بنچ‌مارک جدید SA-Co با ۲۷۰ هزار مفهوم (۵۰ برابر بزرگ‌تر از قبلی‌ها!)

دو برابر دقیق‌تر از مدل‌های قبلی در بخش‌بندی تصویر و ویدیو

عملکرد نزدیک به ۷۵–۸۰٪ انسان

پردازش یک تصویر شلوغ در فقط ۳۰ میلی‌ثانیه روی GPU H200

مدل ۸۴۸ میلیون پارامتری

📦 مدل‌ها + 📚 کدها + 📊 بنچ‌مارک SA-Co
همه هم روی Hugging Face در دسترسه

مقاله | مدل و دیتاست | دمو
👍25🔥85
This media is not supported in your browser
VIEW IN TELEGRAM
نه بابا هوش مصنوعی قراره دنیارو بگیره.
👀28🤯52💯2
قابلیت نسبتا جدید infographic در نوت بوک lm

من روی مقاله ی Vision Transformer تست کردم و عکس زیرو داد

https://notebooklm.google.com
👍237🤯5
An_Image_Is_Worth_16x16_Words.pdf
12.1 MB
اینم از قابلیت Slide deck روی همون مقاله
🤯23👍2
2025/12/05 04:19:04
Back to Top
HTML Embed Code: