tgoop.com/ai_python/17674
Last Update:
این توییت از Lisan al Gaib در X درباره محدودیتهای مدلهای هوش مصنوعی در حل مسائل پیچیده مانند مسئله برج هانوی (Tower of Hanoi) صحبت میکند. او اشاره میکند که مدل Sonnet 3.7 هنگام حل این مسئله برای n=9 و n=10، به دلیل طولانی بودن پاسخ، زود متوقف میشود.
@WearebiTs
چند نکته کلیدی از این پست:
مدلها تصمیم میگیرند که زودتر متوقف شوند، زیرا از نظر آنها محاسبه تمام مراحل، زمانبر و غیرضروری است.
مدل Sonnet 3.7 تا ۸ دیسک محاسبه را انجام میدهد، اما برای تعداد بالاتر متوقف میشود.
خطای ناشی از نمونهگیری مدل باعث کاهش دقت میشود، زیرا احتمال اشتباه در پیشبینی هر توکن هرچند اندک، در تعداد بالا جمع شده و تأثیرگذار میشود.
مدلهای مختلف محدودیت خروجی دارند (مثلاً Sonnet 3.7 دارای محدودیت 128k توکن، DeepSeek R1 دارای 64k توکن).
این پست به طور کلی بحث میکند که چگونه مدلهای زبانی هوش مصنوعی با افزایش پیچیدگی مسئله، به دلیل محدودیتهای خروجی و استراتژیهای خود، دقتشان کاهش پیدا میکند.
https://x.com/scaling01/status/1931817022926839909
BY DLeX: AI Python
Share with your friend now:
tgoop.com/ai_python/17674
