tgoop.com/cvision/4292
Last Update:
قبلاً در مورد SAM 3 و نسخههای سهبعدی مثل SAM 3D Objects و SAM 3D Body بحث کردیم...
متا یک قدم جلوتر رفته و استاندارد جدیدی در بین مدلهای بینایی کامپیوتری ساخته:
قابلیت Segment Anything with Concepts!
نسخهی جدید SAM 3 نه فقط اشیاء رو تشخیص میده، بلکه با پرامپت مفهومی میتونی هر چیزی رو با یک عبارت ساده بخشبندی کنی؛ از «اتوبوس مدرسه زرد» گرفته تا «بازیکنی با لباس سفید».
مدل میتونه بین مفاهیم نزدیک خیلی دقیق تمایز بذاره—حتی در ویدیوهای شلوغ!
این کار با معماری جدید Presence Head انجام میشه
زیرساخت مدل:
دیتاست عظیم شامل ۴ میلیون مفهوم
بنچمارک جدید SA-Co با ۲۷۰ هزار مفهوم (۵۰ برابر بزرگتر از قبلیها!)
دو برابر دقیقتر از مدلهای قبلی در بخشبندی تصویر و ویدیو
عملکرد نزدیک به ۷۵–۸۰٪ انسان
پردازش یک تصویر شلوغ در فقط ۳۰ میلیثانیه روی GPU H200
مدل ۸۴۸ میلیون پارامتری
📦 مدلها + 📚 کدها + 📊 بنچمارک SA-Co
همه هم روی Hugging Face در دسترسه
مقاله | مدل و دیتاست | دمو
BY Tensorflow(@CVision)
Share with your friend now:
tgoop.com/cvision/4292
