DLeX: AI Python@ai_python P.17674

این توییت از Lisan al Gaib در X درباره محدودیت‌های مدل‌های هوش مصنوعی در حل مسائل پیچیده مانند مسئله برج هانوی (Tower of Hanoi) صحبت می‌کند. او اشاره می‌کند که مدل Sonnet 3.7 هنگام حل این مسئله برای n=9 و n=10، به دلیل طولانی بودن پاسخ، زود متوقف می‌شود.

@WearebiTs

چند نکته کلیدی از این پست:

مدل‌ها تصمیم می‌گیرند که زودتر متوقف شوند، زیرا از نظر آن‌ها محاسبه تمام مراحل، زمان‌بر و غیرضروری است.

مدل Sonnet 3.7 تا ۸ دیسک محاسبه را انجام می‌دهد، اما برای تعداد بالاتر متوقف می‌شود.

خطای ناشی از نمونه‌گیری مدل باعث کاهش دقت می‌شود، زیرا احتمال اشتباه در پیش‌بینی هر توکن هرچند اندک، در تعداد بالا جمع شده و تأثیرگذار می‌شود.

مدل‌های مختلف محدودیت خروجی دارند (مثلاً Sonnet 3.7 دارای محدودیت 128k توکن، DeepSeek R1 دارای 64k توکن).

این پست به طور کلی بحث می‌کند که چگونه مدل‌های زبانی هوش مصنوعی با افزایش پیچیدگی مسئله، به دلیل محدودیت‌های خروجی و استراتژی‌های خود، دقتشان کاهش پیدا می‌کند.

https://x.com/scaling01/status/1931817022926839909

www.tgoop.com/ai_python/17674

2.61K viewsNaviD DariYa, Jul 20 at 09:01

tgoop.com/ai_python/17674

Create: 2025-07-20
Last Update: 2025-10-25 06:36:53

BY DLeX: AI Python

Share with your friend now:
tgoop.com/ai_python/17674

Telegram News