🟢کمپانیOpenAI بنچمارک جدیدی برای بررسی عملکرد هوش مصنوعی در وظایف واقعی معرفی کرد
🔸کمپانی OpenAI با معرفی آزمون جدیدی که GDPval نام دارد، عملکرد مدلهای هوش مصنوعی را در وظایف واقعی و شغلی بررسی کرده است. نتایج این آزمون نشان میدهد که GPT-5 و Claude Opus 4.1 به سطحی نزدیک شدهاند که میتوانند خروجیهایی مشابه متخصصان انسانی ارائه کنند.
🔸براساس توضیحات این شرکت، GDPval شامل ١٣٢٠ وظیفه واقعی از ۴۴ شغل مختلف مانند مهندسی نرمافزار، وکالت و پرستاری میشود. این وظایف توسط گروهی از متخصصان با میانگین ١۴ سال تجربه کاری طراحی شدهاند. همچنین از یک نقشه مهندسی گرفته تا لایحه حقوقی و طرحی برای مراقبتهای پرستاری، فرمت خروجی مدلها میتواند متفاوت باشد.
🔸کمپانی #OpenAI تأکید کرده که برخلاف بنچمارکهای متداول که اغلب ماهیت آکادمیک دارند، GDPval مدلها را با فایلها و ارائههای چندرسانهای مانند اسلاید و اسناد به چالش میکشد. با این کار، غول هوش مصنوعی تلاش کرده تا وظایف مدلها را به وظایف یک نیروی کار واقعی نزدیکتر کند.
🟢کمپانیOpenAI بنچمارک جدیدی برای بررسی عملکرد هوش مصنوعی در وظایف واقعی معرفی کرد
🔸کمپانی OpenAI با معرفی آزمون جدیدی که GDPval نام دارد، عملکرد مدلهای هوش مصنوعی را در وظایف واقعی و شغلی بررسی کرده است. نتایج این آزمون نشان میدهد که GPT-5 و Claude Opus 4.1 به سطحی نزدیک شدهاند که میتوانند خروجیهایی مشابه متخصصان انسانی ارائه کنند.
🔸براساس توضیحات این شرکت، GDPval شامل ١٣٢٠ وظیفه واقعی از ۴۴ شغل مختلف مانند مهندسی نرمافزار، وکالت و پرستاری میشود. این وظایف توسط گروهی از متخصصان با میانگین ١۴ سال تجربه کاری طراحی شدهاند. همچنین از یک نقشه مهندسی گرفته تا لایحه حقوقی و طرحی برای مراقبتهای پرستاری، فرمت خروجی مدلها میتواند متفاوت باشد.
🔸کمپانی #OpenAI تأکید کرده که برخلاف بنچمارکهای متداول که اغلب ماهیت آکادمیک دارند، GDPval مدلها را با فایلها و ارائههای چندرسانهای مانند اسلاید و اسناد به چالش میکشد. با این کار، غول هوش مصنوعی تلاش کرده تا وظایف مدلها را به وظایف یک نیروی کار واقعی نزدیکتر کند.
Step-by-step tutorial on desktop: The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021. According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. How to Create a Private or Public Channel on Telegram?
from us