tgoop.com/biasvariance_ir/436
Last Update:
به تازگی Martin Riedmiller مقاله بسیار مهمی را به چاپ رسانده که نشان می دهد چگونه از روش AC می توان برای مدلهای بزرگ استفاده کرد. خواندن مقاله را توصیه می کنیم. قبلا اشاره کرده بودیم که استفاده از مدلهای زبانی در یادگیری تقویتی در حال گسترش است. از بابت پرپارامتر بودن نگران نباشید. می توان با فریز کردن تا حدود زیادی دانش این شبکه ها را انتقال داد. از سویی به تازگی مشاهده کرده ایم که ظاهرا کولب وی رم پانزده گیگی به صورت رایگان در اختیار کاربران قرار می دهد که خبر خوبی است.
Offline Actor-Critic Reinforcement Learning Scales to Large Models
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
#معرفی_مقاله #معرفی_منبع #یادگیری_عمیق #یادگیری_تقویتی #شبکه_عصبی
ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
BY Bias Variance
Share with your friend now:
tgoop.com/biasvariance_ir/436