TECHTUBE Telegram 13201
شرکت OpenAI از قدرتمندترین مدل هوش مصنوعی با نام o3 رونمایی کرده.

این دومین مدل از سری o مدلهای متنی OpenAI هست که اصولا باید o2 نام میگرفت، ولی به دلیل تداخل با نام اپراتور انگلیسی o2، نام o3 برای اون استفاده شده. برخلاف مدلهای قبلی مثل 4o که سریعا جواب میدادن، این مدلها مرحله ای برای تفکر و استدلال دارن که در هنگام جواب دادن به کاربر، مدل برنامه ای برای حل مساله ای که کاربر داده، میسازه و بعد از اون جوابهای مختلف برای حل اون مساله رو بررسی میکنه تا در نهایت به جوابی که از همه بهتره برسه.

در گذشته طراحان مدلها تمام توانشون رو در حین تمرین مدلها (Pre-Training) میذاشتن تا کارایی اونهارو افزایش بدن، ولی این شیوه به دلایل نیاز روزافزون به سخت افزارهای قویتر دیگه مثل سابق اونقدرها که باید توان مدلهارو افزایش نمیده در نتیجه طراحان مدلها از شیوه جدیدی برای تفکر و استدلال مدل در حین اجرا (Post-Training) استفاده میکنن تا کارایی اونهارو بالاتر ببرن.

بدین صورت به مدل در حین اجرا و جواب دادن به درخواستهای کاربر، زمانی برای تفکر داده میشه که باعث افزایش زمان پاسخگویی و منابع موردنیاز میشه، ولی در عوض میتونه سوالات پیچیده و چالشی رو بهتر حل کنه.

نتایج این مدل هم درخشان هستن، در حالی که بقیه مدلها در تست Frontier Math، که شامل سوالات بسیار پیچیده ریاضی هست، فقط امتیاز 2 درصدی کسب کردن، در این o3 امتیاز 25 درصدی رو به دست اورده!

در تست ARC-AGI، که شامل سوالاتی هست که برای انسان به نسبت ساده هستن ولی برای مدلهای هوش مصنوعی سختن، مدل o1 امتیاز 32 درصدی کسب کرده بود ولی حالا o3 رکورد این تست رو شکونده و امتیازی 87.5 درصدی کسب کرده! برای مقایسه امتیاز مدل 4o در این تست 5 درصد و امتیاز انسان در این تست حدود 85 درصد هست.

اما این مدل، مدل بسیار سنگینی هست و تخمین زده میشه که برای حل 100 سوال ARC-AGI، بین نیم تا یک میلیون دلار هزینه اجرای این مدل بوده! این هزینه به مرور زمان پایینتر میاد ولی کماکان هزینه بسیار بالایی هست و به شایعه اشتراک جدید OpenAI که 2000 دلار در ماه قیمت داره، قوت بیشتری میده!

مدل o3 و نسخه سبکتر و سریعتر اون o3-mini در حال حاضر در ازمایشات ایمنی به سر میبرن و مدل مینی احتمالا اوایل سال اینده میلادی به صورت محدود در دسترس کاربران قرار بگیره.

🔎 arstechnica

📍 @TechTube



tgoop.com/TechTube/13201
Create:
Last Update:

شرکت OpenAI از قدرتمندترین مدل هوش مصنوعی با نام o3 رونمایی کرده.

این دومین مدل از سری o مدلهای متنی OpenAI هست که اصولا باید o2 نام میگرفت، ولی به دلیل تداخل با نام اپراتور انگلیسی o2، نام o3 برای اون استفاده شده. برخلاف مدلهای قبلی مثل 4o که سریعا جواب میدادن، این مدلها مرحله ای برای تفکر و استدلال دارن که در هنگام جواب دادن به کاربر، مدل برنامه ای برای حل مساله ای که کاربر داده، میسازه و بعد از اون جوابهای مختلف برای حل اون مساله رو بررسی میکنه تا در نهایت به جوابی که از همه بهتره برسه.

در گذشته طراحان مدلها تمام توانشون رو در حین تمرین مدلها (Pre-Training) میذاشتن تا کارایی اونهارو افزایش بدن، ولی این شیوه به دلایل نیاز روزافزون به سخت افزارهای قویتر دیگه مثل سابق اونقدرها که باید توان مدلهارو افزایش نمیده در نتیجه طراحان مدلها از شیوه جدیدی برای تفکر و استدلال مدل در حین اجرا (Post-Training) استفاده میکنن تا کارایی اونهارو بالاتر ببرن.

بدین صورت به مدل در حین اجرا و جواب دادن به درخواستهای کاربر، زمانی برای تفکر داده میشه که باعث افزایش زمان پاسخگویی و منابع موردنیاز میشه، ولی در عوض میتونه سوالات پیچیده و چالشی رو بهتر حل کنه.

نتایج این مدل هم درخشان هستن، در حالی که بقیه مدلها در تست Frontier Math، که شامل سوالات بسیار پیچیده ریاضی هست، فقط امتیاز 2 درصدی کسب کردن، در این o3 امتیاز 25 درصدی رو به دست اورده!

در تست ARC-AGI، که شامل سوالاتی هست که برای انسان به نسبت ساده هستن ولی برای مدلهای هوش مصنوعی سختن، مدل o1 امتیاز 32 درصدی کسب کرده بود ولی حالا o3 رکورد این تست رو شکونده و امتیازی 87.5 درصدی کسب کرده! برای مقایسه امتیاز مدل 4o در این تست 5 درصد و امتیاز انسان در این تست حدود 85 درصد هست.

اما این مدل، مدل بسیار سنگینی هست و تخمین زده میشه که برای حل 100 سوال ARC-AGI، بین نیم تا یک میلیون دلار هزینه اجرای این مدل بوده! این هزینه به مرور زمان پایینتر میاد ولی کماکان هزینه بسیار بالایی هست و به شایعه اشتراک جدید OpenAI که 2000 دلار در ماه قیمت داره، قوت بیشتری میده!

مدل o3 و نسخه سبکتر و سریعتر اون o3-mini در حال حاضر در ازمایشات ایمنی به سر میبرن و مدل مینی احتمالا اوایل سال اینده میلادی به صورت محدود در دسترس کاربران قرار بگیره.

🔎 arstechnica

📍 @TechTube

BY TechTube 𝕏 تک توب








Share with your friend now:
tgoop.com/TechTube/13201

View MORE
Open in Telegram


Telegram News

Date: |

According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. How to create a business channel on Telegram? (Tutorial) While some crypto traders move toward screaming as a coping mechanism, many mental health experts have argued that “scream therapy” is pseudoscience. Scientific research or no, it obviously feels good. Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them. Co-founder of NFT renting protocol Rentable World emiliano.eth shared the group Tuesday morning on Twitter, calling out the "degenerate" community, or crypto obsessives that engage in high-risk trading.
from us


Telegram TechTube 𝕏 تک توب
FROM American