Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
633 - Telegram Web
Telegram Web
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#مقاله

یک ایده خاص! شبیه ایده ی bag of vectors یا bag of words اما در تصویر!

این مقاله از ویژگی های محلی استفاده کرده و به ارتباط مکانی ویژگی ها کاری ندارد. با این وجود تنها با patchهای ۱۷ در ۱۷ به دقت معادل شبکه الکس نت رسیده است.
در این شبکه هر کلاس یک heatmap خواهد داشت که در نهایت روی میانگین روی هر heatmap تنها تابع فعالیت softmax اعمال میشود.
از مهمترین ویژگی های این شبکه تفسیر پذیری بالای آن است.

"Approximating CNNs with Bag-of-local-Features models works surprisingly well on ImageNet"

A "bag of words" of nets on tiny 17x17 patches suffice to reach AlexNet-level performance on ImageNet.
A lot of the information is very local.

https://www.tgoop.com/cvision/984
من به صورت اتفاقی به کدهای مباحث ویژه، بازشناسی اشیاء با وبکم دانشجوها نگاه کردم،
رایج ترین اشتباه این بوده که تصویر فریم خوانده شده با opencv از وبکم برای داده شدن به یک شبکه pretrained ترتیب کانالهاش اشتباه بوده.
در opencv تصویر bgr لود میشود و pill که تو خود کراس استفاده نیکنیم rgb
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
خروجی خشن مدل #gpt2
همین الان با جمله
The first thing the powerful AI do
تستش کردم، و این مدل زبانی خروجی که در تصویر مشاهده میکنید را تولید کرد!

در مورد این مدل بیشتر بدانید:
https://www.tgoop.com/cvision/1026
خودتان هم تست کنید:
https://www.tgoop.com/cvision/1035

#gpt2 #nlp
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#آموزش #منبع #کورس #ویدیو
اسلایدها و ویدیوهای کورس بینایی ماشین و یادگیری عمیق و شبکه های کانولوشنالی دانشگاه MIT

Intro to DeepLearning lecture on Deep Computer Vision and Convolutional Neural Networks

MIT course schedule and slides:
http://introtodeeplearning.com

Lecture Video:
https://www.youtube.com/watch?v=H-HVZJ7kGI0&list=PLtBw6njQRU-rwp5__7C0oIVt26ZgjG9NI&t=0s&index=15

#MIT #slides
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#سورس_کد #آموزش

57 نوت بوک یادگیری عمیق و بینایی ماشین

مباحث ویژه ی 1و 2 مقطع کارشناسی دانشگاه شهید رجایی با موضوع مقدمت بینایی کاپیوتر و یادگیری ژرف مقدماتی و پیشرفته بود و در ترم بهمن 96 و مهر 97 برگزار شد.
با تشکر از آقای ستاریان @MH_Sattarian که لینک های اسلایدهای مرتبط و فیلمهای مرتبط هر نوت بوک را فعلا برای مباحث مباحث ویژه 1 در گیت هاب طبقه بندی کردند. به زودی این لیست تکمیل می‌شود.

https://github.com/Alireza-Akhavan/class.vision

#opencv #keras #tensorflow #deep_learning
تشخیص چهره- بخش اول- علیرضا اخوان پور-1

•one-shot learning: Face Verification & Recognition
•Siamese network
•facenet triplet loss

برای مشاهده این ویدئو به آدرس زیر مراجعه نمایید :
https://www.aparat.com/v/xdC7r

برای آگاهی از انتشار ویدئو های بعدی به کانال ما مراجعه نمایید:
@partdpai
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#سورس_کد #آموزش

نوت بوک‌های یادگیری عمیق و بینایی ماشین

مباحث ویژه ی 1و 2 مقطع کارشناسی دانشگاه شهید رجایی با موضوع مقدمت بینایی کامپیوتر و یادگیری ژرف مقدماتی و پیشرفته بود و در ترم بهمن 96 و مهر 97 برگزار شد.
آقای ستاریان که @MH_Sattarian لینک های اسلایدهای مرتبط و فیلمهای مرتبط هر نوت بوک را قبلا برای مباحث ویژه 1 در گیت هاب طبقه بندی کرده بودند. به زودی این لیست تکمیل می‌شود.
زحمت کشیدند و این لیست را با مطالب مباحث ویژه دو کامل کردند.

این ریپوزیتوری در سه بخش اصلی:
Computer Vision
Machine Learning
Deep Learning
است.

به زودی ویدیوهای مرتبط در آپارات هم لینک خواهند شد.

https://github.com/Alireza-Akhavan/class.vision

#opencv #keras #tensorflow #deep_learning
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#آموزش
راهنمای کراس در تنسرفلوی ۲.۰ در سایت تنسرفلو.
https://www.tensorflow.org/alpha/guide/keras/

#keras #tensorflow2
"If you're not having fun, you're not learning. There's a pleasure in finding things out." - Richard Feynman
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#چالش جالب و عجیب جدید kaggle

بر اساس تصویر چهره، داشتن یا نداشتن نسبت خونی را تشخیص دهید!

https://www.kaggle.com/c/recognizing-faces-in-the-wild/

#face
Forwarded from Python_Labs🐍 (Alireza Akhavan)
#خبر
شغلهای برتر سال 2019 ...
سه شغل از 4 شغل برتر امسال متعلق به حوزه های مرتبط با یادگیری ماشین، علم داده و بینایی ماشین است!
همچنین نیمی از 10 شغل نخست امسال کامپیوتری است

Here are the top ten “best” jobs ranked in order of base salary, together with the position’s historical job growth:
1. Machine learning engineer: $136,241 with 166% growth

2. Data scientist: $132,915 with 106% growth

3. Optometrist: $131,692 with 118% growth

4. Computer vision engineer: $131,297 with 169% growth

5. Development operations engineer: $125,714 with 91% growth

6. Agile coach: $120,142 with 80% growth

7. Chief estimator: $116,848 with 101% growth

8. Full stack developer: $111,640 with 198% growth

9. Head of sales: $108,788 with 42% growth

10. Staff pharmacist: $107,584 with 42% growth

https://howmuch.net/articles/there-are-the-hottest-jobs-in-us-2018-lots-of-opening-and-dream-salaries
ذخیره تصویر، PIL یا OpenCV ؟
طبق توئیت آخر جرمی هاوارد، استفاده از PIL برای ذخیره تصویر در پایتون، در حدود ۸ برابر کند تر از معادل در OpenCV است!
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
کدها (نوت بوک) به همراه اسلاید ورک‌شاپ شبکه های عصبی بازگشتی (RNN) در تنسرفلو 2 و کراس که در صندوق نوآوری و شکوفایی برگزار گردید در گیت‌هاب آپلود شدند:

https://github.com/Alireza-Akhavan/rnn-notebooks
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
سرفصل های این دوره:

قسمت اول – 18 دقیقه - مقدمات شبکه های بازگشتی
قسمت دوم – 21 دقیقه - یک سلول (واحد) بازگشتی ساده و شبکه بازگشتی
قسمت سوم – 32 دقیقه - پیاده‌سازی تخمین تابع با شبکه‌های بازگشتی ساده
قسمت چهارم – 4 دقیقه - طول دنباله متغیر در شبکه‌های بازگشتی (۱)
قسمت پنجم – 11 دقیقه - طول دنباله متغیر در شبکه‌های بازگشتی (۲)
قسمت شـشـم – 19 دقیقه - محو شدگی و انفجار گرادیان‌ها در شبکه‌های بازگشتی
قسمت هفتم – 26 دقیقه - شبکه‌های GRU
قسمت هشتم – 8 دقیقه - شبکه‌های LSTM
قسمت نهم – 9 دقیقه - دیاگرام شبکه‎های LSTM
قسمت دهم – 9 دقیقه - مثال‌هایی از داده‌های توالی و ترتیبی
قسمت یازدهم – 5 دقیقه - شبکه‌های بازگشتی عمیق
قسمت دوازدهم – 34 دقیقه - تخمین قیمت ارزهای دیجیتال – پیش‌پردازش داده
قسمت سیزدهم – 22 دقیقه - تخمین قیمت ارزهای دیجیتال – بالانس کردن داده‌ها و آموزش
قسمت چهاردهم – 34 دقیقه - شبکه‌های بازگشتی برای طبقه‌بندی ویدیو – مثال تشخیص جهت حرکت توپ
قسمت پانزدهم – 41 دقیقه - مثال دوم طبقه‌بندی ویدیو – بازشناسی عملکرد در ویدیو
قسمت شانزدهم – 32 دقیقه - درک بردار کلمات و بازنمایی آن‌ها
قسمت هفدهم – 11 دقیقه - ویژگی‌های بازنمایی کلمات و لایه Embedding
قسمت هجدهم – 27 دقیقه - مثال عملی آنالوژی با بردار کلمات
قسمت نوزدهم – 14 دقیقه - طبقه‌بندی متن
قسمت بـیـسـتـم – 20 دقیقه - پیاده‌سازی طبقه‌بندی متن با روش Bag-of-Embeddings
قسمت بیست و یکم – 29 دقیقه - طبقه‌بندی متن با شبکه بازگشتی
قسمت بیست و دوم – 57 دقیقه - مدل زبانی – تولید اشعاری شبیه به شاهنامه
قسمت بیست و سوم –16 دقیقه - جمع‌بندی و معرفی شبکه‌های بازگشتی دوطرفه
قسمت بیست و چهارم – 14 دقیقه - مدل‌های توالی به توالی
قسمت بیست و پنجم – 27 دقیقه - مثال عملی Seq2Seq برای فهم رشته عملیات ریاضی
قسمت بیست و شـشـم – 15 دقیقه - مقدمات ترجمه ماشینی
قسمت بیست و هفتم – 15 دقیقه - الگوریتم جست و جوی پرتو
قسمت بیست و هشـتم – 60 دقیقه - مکانیزم توجه در ترجمه ماشینی
قسمت بیست و نهم – 30 دقیقه - پیاده‌سازی ترجمه ماشینی در کراس برای تبدیل تاریخ
قسمت سـی‌ام – 15 دقیقه - روش کمک معلم
قسمت سی و یکم – 41 دقیقه - پیاده‌سازی ترجمه ماشینی با مکانیزم توجه و Teacher Forcing در تنسرفلو ۲
قسمت سی‌ و دوم – 28 دقیقه - شرح تصاویر با توجه بصری


Part 1 – 18 Minutes - Introduction to Recurrent Neural Networks
Part 2 – 21 Minutes - A Simple RNN Unit & RNN Network
Part 3 – 32 Minutes - Sinewave Prediction using RNN
Part 4 – 4 Minutes - Variable RNN sequence lengths (1)
Part 5 – 11 Minutes - Variable RNN sequence lengths (2)
Part 6 – 19 Minutes - Exploding and Vanishing Gradients in RNNs
Part 7 – 26 Minutes - Gated Recurrent Unit (GRU) Networks
Part 8 – 8 Minutes - Long Short-Term Memory (LSTM) Networks
Part 9 – 9 Minutes - LSTM in Picture
Part 10 – 9 Minutes - Examples of Sequential Data
Part 11 – 5 Minutes - Deep RNNs
Part 12 – 34 Minutes - Cryptocurrency Price Prediction – Data Pre-Processing
Part 13 – 22 Minutes - Cryptocurrency Price Prediction – Handling Imbalanced Data and Model Training
Part 14 – 34 Minutes - RNN for Image Classification – Determining the Direction of the Ball
Part 15 – 41 Minutes - Video Classification and Action Recognition using RNN
Part 16 – 32 Minutes - Understanding Word Embeddings
Part 17 – 11 Minutes - Word Analogy, Embedding Layer in Keras
Part 18 – 27 Minutes - Solving Analogies by Representing Words as Vectors
Part 19 – 14 Minutes - Text Classification
Part 20 – 20 Minutes - Bag-of-Embeddings for Text Classification
Part 21 – 29 Minutes - Text Classification with an RNN
Part 22 – 57 Minutes - Text Generation with an RNN (Language Model)
Part 23 – 16 Minutes - Review – Bidirectional RNNs
Part 24 – 14 Minutes - Seq2Seq Models
Part 25 – 27 Minutes - Practical Example of Seq2Seq for Understanding the Mathematical Operations
Part 26 – 15 Minutes - Introduction to Machine Translation
Part 27 – 15 Minutes - Beam Search
Part 28 – 60 Minutes - Attention in Neural Machine Translation
Part 29 – 30 Minutes - Neural Machine Translation for Converting Date in Keras
Part 30 – 15 Minutes - Teacher Forcing
Part 31 – 41 Minutes - Neural Machine Translation with Attention and Teacher Forcingin TF2.0
Part 32 – 28 Minutes - Image Captioning with Visual Attention
2025/01/01 23:47:52
Back to Top
HTML Embed Code: