Telegram Web
در panda میتوانید چولگی توزیع داده را با متد زیر مشخص کنید:


df.skew()
#آموزش

Using XGBoost in Python

یک روش یادگیری ماشین انعطاف پذیر محبوب در سالهای اخیر که در مسائل رگرسیون، طبقه بندی و رنکینگ میتونه استفاده بشه.
در چالش های کگل برنده های زیادی از این روش استفاده کرده اند.
آموزش ساده آن در پایتون را میتوانید بخوانید.

https://www.datacamp.com/community/tutorials/xgboost-in-python

#XGBoost
باگی که حدود 1 سال در ipython رفع نشده بود و هزاران نفر باهاش مشکل داشتند اخیرا با فقط یک خط کد رفع شد.

fix a memory leak on exception (caused by the stored traceback) #11572
https://github.com/ipython/ipython/pull/11572
Python_Labs🐍
باگی که حدود 1 سال در ipython رفع نشده بود و هزاران نفر باهاش مشکل داشتند اخیرا با فقط یک خط کد رفع شد. fix a memory leak on exception (caused by the stored traceback) #11572 https://github.com/ipython/ipython/pull/11572
برای همین ارزش یه کد به تعداد خطوطش نیست :)
توی درس برنامه نویسی پیشرفته یه سری دوستانی که میخواستند بگند خیلی پروژمون قویه تعداد خط کد زیادشون را اعلام میکردند ...
Media is too big
VIEW IN TELEGRAM
9999999999999999.0 - 9999999999999998.0 = 2

عجیب اما منطقی
دلیل این باگ به زبان #جادی
Top 20 Python libraries for Data Science (2018)
پست مرتبط:
https://www.tgoop.com/PyLab/328

#XGBoost in Python
Accessing class and function names at runtime
#pytrick
#sample_code #pandas #sklearn
Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
Python_Labs🐍
#sample_code #pandas #sklearn Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
خروجی نمونه قبل و بعد از این کار.
خاطرتون هست چرا encode میکردیم؟
#sample_code partII
در ادامه کد قبل. تبدیل encode شده ها به عدد به فرمت one hot
This media is not supported in your browser
VIEW IN TELEGRAM
#vscode
IPython console in VS Code! The update to the code #Python extension extended the Python Interactive window to allow code to be typed in and executed directly in the window! Check it out 👉 https://blogs.msdn.microsoft.com/pythonengineering/2019/01/29/python-in-visual-studio-code-january-2019-release/
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#خبر #مجموعه_داده

اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30


https://research.cafebazaar.ir/visage/datasets/
#آموزش

میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.

در sklearn دو روش اصلی موجود است.

روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو می‌کند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.

from sklearn.model_selection import GridSearchCV


روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.

from sklearn.model_selection import RandomizedSearchCV



#GridSearch #RandomizedSearch
نمونه کد GridSearch .در این مساله 2160 ترکیب مختلف از هایپرپارامترهایی که در دیکشنری xg_cl_param_grid مشاهده میشود.
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.

https://www.tgoop.com/PyLab/347
2025/07/13 03:47:13
Back to Top
HTML Embed Code: