#آموزش
Using XGBoost in Python
یک روش یادگیری ماشین انعطاف پذیر محبوب در سالهای اخیر که در مسائل رگرسیون، طبقه بندی و رنکینگ میتونه استفاده بشه.
در چالش های کگل برنده های زیادی از این روش استفاده کرده اند.
آموزش ساده آن در پایتون را میتوانید بخوانید.
https://www.datacamp.com/community/tutorials/xgboost-in-python
#XGBoost
Using XGBoost in Python
یک روش یادگیری ماشین انعطاف پذیر محبوب در سالهای اخیر که در مسائل رگرسیون، طبقه بندی و رنکینگ میتونه استفاده بشه.
در چالش های کگل برنده های زیادی از این روش استفاده کرده اند.
آموزش ساده آن در پایتون را میتوانید بخوانید.
https://www.datacamp.com/community/tutorials/xgboost-in-python
#XGBoost
Datacamp
Learn XGBoost in Python: A Step-by-Step Tutorial
Discover the power of XGBoost, one of the most popular machine learning frameworks among data scientists, with this step-by-step tutorial in Python. From installation to creating DMatrix and building a classifier, this tutorial covers all the key aspects
Python_Labs🐍
#آموزش Using XGBoost in Python یک روش یادگیری ماشین انعطاف پذیر محبوب در سالهای اخیر که در مسائل رگرسیون، طبقه بندی و رنکینگ میتونه استفاده بشه. در چالش های کگل برنده های زیادی از این روش استفاده کرده اند. آموزش ساده آن در پایتون را میتوانید بخوانید.…
دوستان کلاس مباحث ویژه که دسترسی رایگان به ایشان داده شده میتوانند کورس مرتبط را از لینک زیر بگذرانند:
https://www.datacamp.com/courses/extreme-gradient-boosting-with-xgboost
https://www.datacamp.com/courses/extreme-gradient-boosting-with-xgboost
Datacamp
Extreme Gradient Boosting with XGBoost Course | DataCamp
Explore the fundamentals of gradient boosting, with a focus on Regression with XGBoost, using XGBoost in pipelines and how to fine-tune your XGBoost model.
باگی که حدود 1 سال در ipython رفع نشده بود و هزاران نفر باهاش مشکل داشتند اخیرا با فقط یک خط کد رفع شد.
fix a memory leak on exception (caused by the stored traceback) #11572
https://github.com/ipython/ipython/pull/11572
fix a memory leak on exception (caused by the stored traceback) #11572
https://github.com/ipython/ipython/pull/11572
Python_Labs🐍
باگی که حدود 1 سال در ipython رفع نشده بود و هزاران نفر باهاش مشکل داشتند اخیرا با فقط یک خط کد رفع شد. fix a memory leak on exception (caused by the stored traceback) #11572 https://github.com/ipython/ipython/pull/11572
برای همین ارزش یه کد به تعداد خطوطش نیست :)
توی درس برنامه نویسی پیشرفته یه سری دوستانی که میخواستند بگند خیلی پروژمون قویه تعداد خط کد زیادشون را اعلام میکردند ...
توی درس برنامه نویسی پیشرفته یه سری دوستانی که میخواستند بگند خیلی پروژمون قویه تعداد خط کد زیادشون را اعلام میکردند ...
#fun
This new Google Translate update is really helpful
https://www.reddit.com/r/ProgrammerHumor/comments/ajf4w0/this_new_google_translate_update_is_really_helpful/
This new Google Translate update is really helpful
https://www.reddit.com/r/ProgrammerHumor/comments/ajf4w0/this_new_google_translate_update_is_really_helpful/
#sample_code #pandas #sklearn
Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
Python_Labs🐍
#sample_code #pandas #sklearn Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
خروجی نمونه قبل و بعد از این کار.
خاطرتون هست چرا encode میکردیم؟
خاطرتون هست چرا encode میکردیم؟
#sample_code partII
در ادامه کد قبل. تبدیل encode شده ها به عدد به فرمت one hot
در ادامه کد قبل. تبدیل encode شده ها به عدد به فرمت one hot
This media is not supported in your browser
VIEW IN TELEGRAM
#vscode
IPython console in VS Code! The update to the code #Python extension extended the Python Interactive window to allow code to be typed in and executed directly in the window! Check it out 👉 https://blogs.msdn.microsoft.com/pythonengineering/2019/01/29/python-in-visual-studio-code-january-2019-release/
IPython console in VS Code! The update to the code #Python extension extended the Python Interactive window to allow code to be typed in and executed directly in the window! Check it out 👉 https://blogs.msdn.microsoft.com/pythonengineering/2019/01/29/python-in-visual-studio-code-january-2019-release/
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#خبر #مجموعه_داده
اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30
https://research.cafebazaar.ir/visage/datasets/
اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30
https://research.cafebazaar.ir/visage/datasets/
#آموزش
میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.
در sklearn دو روش اصلی موجود است.
روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو میکند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.
روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.
#GridSearch #RandomizedSearch
میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.
در sklearn دو روش اصلی موجود است.
روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو میکند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.
from sklearn.model_selection import GridSearchCV
روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.
from sklearn.model_selection import RandomizedSearchCV
#GridSearch #RandomizedSearch
نمونه کد GridSearch .در این مساله 2160 ترکیب مختلف از هایپرپارامترهایی که در دیکشنری xg_cl_param_grid مشاهده میشود.
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.
https://www.tgoop.com/PyLab/347
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.
https://www.tgoop.com/PyLab/347