Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
304 - Telegram Web
Telegram Web
شرکت‌های OpenAI, Oracle و SoftBank امروز اعلام کردن که قراره یک شرکت جدید به نام Stargate تاسیس کنن تا زیرساخت‌های هوش مصنوعی رو در ایالات متحده گسترش بدن. سم آلتمن (مدیرعامل OpenAI)، ماسایوشی سان (مدیرعامل SoftBank) و لری الیسون (رئیس Oracle) در کاخ سفید حضور پیدا کردن و در کنار دونالد ترامپ، این پروژه رو که رئیس جمهور اون رو "بزرگترین پروژه زیرساختی هوش مصنوعی در تاریخ" خوند، معرفی کردن.

این شرکت‌ها در مرحله اول ۱۰۰ میلیارد دلار سرمایه‌گذاری می‌کنن و برنامه دارن که این رقم رو تا ۵۰۰ میلیارد دلار در سال‌های آینده افزایش بدن. طبق گفته ترامپ، این پروژه قراره ۱۰۰ هزار شغل جدید در آمریکا ایجاد کنه. اولین مرکز داده این پروژه که مساحتش یک میلیون فوت مربع هست، هم‌اکنون در تگزاس در حال ساخته.

سم آلتمن که قبلاً هم با مقامات آمریکایی درباره اهمیت توسعه زیرساخت‌های هوش مصنوعی صحبت کرده بود، این پروژه رو "مهم‌ترین پروژه این دوران" خونده. اون تأکید کرده که هوش مصنوعی برخلاف نرم‌افزارهای معمولی، به زیرساخت‌های عظیم، از جمله برق، تراشه‌های کامپیوتری و مراکز داده نیاز داره و آمریکا باید برای پیشتاز موندن در این حوزه، این زیرساخت‌ها رو در داخل کشور بسازه.

در این پروژه، SoftBank مسئولیت مالی و OpenAI مسئولیت عملیاتی رو به عهده می‌گیره و ماسایوشی سان به عنوان رئیس Stargate انتخاب شده. این در حالیه که OpenAI هفته گذشته در یک گزارش اعلام کرد که حدود ۱۷۵ میلیارد دلار سرمایه جهانی آماده سرمایه‌گذاری در پروژه‌های هوش مصنوعی هست و اگر آمریکا نتونه این سرمایه‌ها رو جذب کنه، به سمت پروژه‌های چینی سرازیر می‌شن.

@aipulse24
امروز شرکت Anthropic از قابلیت جدید Citations در API خودش رونمایی کرد. این ویژگی به هوش مصنوعی Claude اجازه میده تا پاسخ‌هاش رو بر اساس منابع موثق ارائه کنه و دقیقاً مشخص کنه که هر بخش از پاسخش رو از کدوم منبع و کدوم قسمت استخراج کرده. این قابلیت باعث میشه خروجی‌های Claude قابل راستی‌آزمایی و مطمئن‌تر باشن.

قبلاً توسعه‌دهندگان مجبور بودن از پرامپت‌های پیچیده استفاده کنن تا Claude اطلاعات منبع رو هم مشخص کنه، که این کار زمان‌بر و غیر قابل اتکا بود. ارزیابی‌ها نشون میده که این قابلیت جدید تا ۱۵ درصد دقت بیشتری نسبت به روش‌های دستی داره.

این ویژگی کاربردهای متنوعی داره، از خلاصه‌سازی اسناد طولانی گرفته تا پاسخگویی به سوالات پیچیده و... ، Claude می‌تونه دقیقاً مشخص کنه که هر بخش از پاسخش رو از کدوم قسمت منابع برداشته. این قابلیت الان روی نسخه‌های Claude 3.5 Sonnet و Claude 3.5 Haiku در دسترسه.

شرکت‌های بزرگی مثل Thomson Reuters و Endex از این قابلیت استفاده می‌کنن و نتایج فوق‌العاده‌ای گرفتن. مثلاً Endex گزارش داده که میزان خطا در ارجاع‌دهی به منابع از ۱۰ درصد به صفر رسیده و تعداد ارجاعات در هر پاسخ ۲۰ درصد افزایش پیدا کرده. این نشون میده که این قابلیت می‌تونه تاثیر قابل توجهی در دقت و قابلیت اطمینان به خروجی‌های هوش مصنوعی داشته باشه.

این قابلیت در حال حاضر فقط از طریق API برای توسعه‌دهندگان در دسترس هست و ممکنه در اینده به نسخه وب و اپ Claude هم اضافه بشه.

@aipulse24
ارزش استارتاپ Clay که در زمینه هوش مصنوعی و پردازش داده‌های فروش فعالیت می‌کنه به رقم ۱.۲۵ میلیارد دلار رسید! این استارتاپ، موفق شده در مدت کوتاه ۶ ماه ارزش خودش رو دو برابر کنه.

استارتاپ Clay با استفاده از هوش مصنوعی پیشرفته، به شرکت‌ها کمک می‌کنه تا مشتریان بالقوه خودشون رو با دقت بیشتری شناسایی کنن. این شرکت با جمع‌آوری و تحلیل داده‌های متنوع مثل نرم‌افزارهایی که شرکت‌ها استفاده می‌کنن، مشتریان فعلی‌شون و سوابق کاری تصمیم‌گیرنده‌های کلیدی، به تیم‌های فروش کمک می‌کنه تا لیدهای باکیفیت‌تری پیدا کنن. جالبه بدونید که Clay از یک ابزار هوش مصنوعی اختصاصی به نام 'Claygent' استفاده می‌کنه که می‌تونه سوالات پیچیده رو تحلیل کنه و نتایج دقیق ارائه بده.

در حال حاضر بیش از ۵۰۰۰ کسب‌وکار از جمله شرکت های مطرحی مثل OpenAI، Anthropic، Canva و Rippling از خدمات Clay استفاده می‌کنن. درآمد این شرکت در سال ۲۰۲۴ به حدود ۳۰ میلیون دلار رسیده و قراردادهای سالانه‌شون به صدها هزار دلار می‌رسه. یه نکته جالب دیگه اینه که یک اکوسیستم قوی حول Clay شکل گرفته - کانال اسلک این شرکت بیش از ۱۸،۰۰۰ کاربر فعال داره و بیش از ۹۰ آژانس مشاوره کوچک، از طریق کمک به شرکت‌ها برای استفاده از Clay درآمدهای قابل توجهی کسب می‌کنن.

موفقیت Clay در کشف الگوهای غیرمنتظره در داده‌ها واقعاً چشمگیره. برای مثال، یکی از مشتریاشون به اسم Intercom (یک یونیکورن در حوزه خدمات مشتری) با استفاده از Clay متوجه شد شرکت‌هایی که کلمه "fertility" توی وبسایتشون هست، احتمال بیشتری داره که به نرم‌افزارشون نیاز داشته باشن - صرف نظر از اینکه توی چه صنعتی فعالیت می‌کنن. این نوع بینش‌های منحصر به فرد که قبلاً کشفشون تقریباً غیرممکن بود، Clay رو به یکی از موفق‌ترین نمونه‌های کاربرد عملی هوش مصنوعی در دنیای کسب‌وکار تبدیل کرده.

نکته قابل توجه دیگه اینه که Clay یک سرمایه‌گذاری ۴۰ میلیون دلاری جدید رو جذب کرده که توسط Meritech انجام شده، اما هنوز از این پول استفاده نکرده.

👀 منبع

@aipulse24
شرکت Retro Biosciences با حمایت سم آلتمن میخواد یک میلیارد دلار سرمایه جذب کنه. هدف این شرکت افزایش ۱۰ ساله طول عمر انسان‌ها در مقایسه با عمر طبیعی یک انسان سالم هست.

سم آلتمن، مدیرعامل OpenAI، پیش از این مبلغ ۱۸۰ میلیون دلار به عنوان سرمایه اولیه به این شرکت اختصاص داده بود و اکنون نیز در دور جدید سرمایه‌گذاری مشارکت میکنه.

این شرکت مستقر در سانفرانسیسکو، که برنامه تولید داروهایی برای درمان بیماری‌هایی نظیر آلزایمر رو داره، اخیراً با همکاری OpenAI موفق شده یک مدل هوش مصنوعی برای تبدیل سلول‌های معمولی به سلول‌های بنیادی طراحی کنه.

جو بتس-لاکروا، مدیرعامل شرکت، اعلام کرده میخواد در دهه ۲۰۲۰ به کشف و توسعه دارو برسه.

این شرکت به جمع پروژه‌های مهم افزایش طول عمر با حمایت میلیاردرها پیوسته، از جمله Altos Labs که در سال ۲۰۲۲ با سرمایه ۳ میلیارد دلاری جف بزوس راه‌اندازی شد و Unity Biotechnology که مورد حمایت بزوس و پیتر تیل قرار داره.

@aipulse24
شرکت OpenAI از مدل جدید خودش به نام o3-mini رونمایی کرده که جدیدترین و مقرون‌به‌صرفه‌ترین مدل در سری مدل‌های استدلالی این شرکته. این مدل الان هم از طریق ChatGPT و هم API در دسترسه. o3-mini توانایی‌های خیلی خوبی در زمینه‌های علمی، ریاضی و برنامه‌نویسی داره، در حالی که هزینه و تأخیر کمتری نسبت به o1-mini داره.

این مدل جدید اولین مدل کوچک OpenAI هست که از ویژگی‌های پرطرفدار توسعه‌دهنده‌ها مثل function calling، Structured Outputs و developer messages پشتیبانی می‌کنه. کاربران می‌تونن بین سه سطح استدلالی - کم، متوسط و زیاد - انتخاب کنن تا برای موارد استفاده خاص خودشون بهینه‌سازی کنن. البته این مدل از قابلیت‌های تصویری پشتیبانی نمی‌کنه و برای وظایف مربوط به تصویر باید از OpenAI o1 استفاده کرد.

در ارزیابی‌های انجام شده، o3-mini با سطح استدلال متوسط، عملکردی مشابه o1 در زمینه‌های ریاضی، کدنویسی و علوم داره، در حالی که پاسخ‌های سریع‌تری ارائه می‌ده. آزمایش‌ها نشون دادن که o3-mini پاسخ‌های دقیق‌تر و واضح‌تری نسبت به o1-mini تولید می‌کنه و توانایی استدلال قوی‌تری داره. در ۵۶٪ موارد، پاسخ‌های o3-mini به o1-mini ترجیح داده شده و خطاهای جدی در سوالات دشوار دنیای واقعی ۳۹٪ کاهش پیدا کرده.

در مقایسه با OpenAI o1، این مدل جدید عملکرد سریع‌تری داره و کارایی بهتری رو نشون می‌ده. در تست‌های A/B، مدل o3-mini پاسخ‌هایی ۲۴٪ سریع‌تر از o1-mini ارائه داده، با میانگین زمان پاسخ ۷.۷ ثانیه در مقایسه با ۱۰.۱۶ ثانیه. کاربران ChatGPT Plus، Team و Pro می‌تونن از همین امروز به o3-mini دسترسی داشته باشن، و دسترسی Enterprise هم طی یک هفته آینده فراهم می‌شه.

@aipulse24
شرکت OpenAI از قابلیت جدید "پژوهش عمیق" در ChatGPT رونمایی کرده که جدیدترین قابلیت این شرکت برای انجام تحقیقات چندمرحله‌ای در اینترنت هست. این قابلیت جدید می‌تونه کاری که برای یک انسان ساعت‌ها طول می‌کشه رو در چند دقیقه به سرانجام برسونه.

پژوهش عمیق که از نسخه بهینه‌شده‌ای از مدل آینده OpenAI o3 قدرت گرفته، می‌تونه صدها منبع آنلاین رو پیدا، تحلیل و ترکیب کنه و یک گزارش جامع در سطح یک تحلیلگر پژوهشی ارائه بده. این قابلیت با استفاده از قدرت استدلال، می‌تونه متن‌ها، تصاویر و فایل‌های PDF رو در اینترنت جستجو، تفسیر و تحلیل کنه.

شرکت OpenAI این قابلیت رو برای افرادی طراحی کرده که در حوزه‌های تخصصی مثل امور مالی، علوم، سیاست‌گذاری و مهندسی به تحقیقات دقیق و قابل اعتماد نیاز دارند. همچنین برای خریدارانی که دنبال توصیه‌های شخصی‌سازی شده برای خریدهایی مثل خودرو، لوازم خانگی و مبلمان هستند هم می‌تونه مفید باشه. تمام خروجی‌های این سیستم با منابع مشخص و خلاصه‌ای از روند تفکر همراه میشه.

برای استفاده از این قابلیت، کاربران می‌تونن در ChatGPT گزینه 'deep research' رو انتخاب کنن و بعد از وارد کردن سوال خودشون، منتظر بمونن تا در مدت ۵ تا ۳۰ دقیقه نتایج تحقیق آماده بشه. OpenAI اعلام کرده که در هفته‌های آینده، امکانات بیشتری مثل تصاویر، نمودارها و سایر خروجی‌های تحلیلی هم به گزارش‌های این ابزار اضافه خواهند شد.

این قابلیت فعلا برای کاربران اشتراک Pro در دسترسه و به زودی برای کاربران Plus و Team هم در دسترس قرار میگیره.

@aipulse24
فریمورک OmniHuman که توسط تیم تحقیقاتی ByteDance توسعه داده شده، یک سیستم پیشرفته برای تولید ویدیوهای انسانی هست که با استفاده از یک تصویر و سیگنال‌های حرکتی کار می‌کنه. این مدل با معرفی یک استراتژی آموزشی ترکیبی جدید، تونسته مشکل کمبود داده‌های باکیفیت رو که چالش اصلی روش‌های قبلی بوده حل کنه. نتیجه این پیشرفت، تولید ویدیوهای فوق‌العاده واقع‌گرایانه با استفاده از سیگنال‌های ضعیف، به‌ویژه صدا هست.

از ویژگی‌های منحصر به فرد این سیستم می‌تونیم به پشتیبانی از هر نوع نسبت تصویر اشاره کنیم. مهم نیست تصویر ورودی پرتره باشه، نیم‌تنه یا تمام‌قد - سیستم می‌تونه با همه این‌ها کار کنه و نتایج با کیفیتی تولید کنه. این قابلیت باعث می‌شه OmniHuman برای طیف گسترده‌ای از کاربردها مناسب باشه و محدودیت‌های معمول در سیستم‌های مشابه رو نداشته باشه.

در زمینه تولید ویدیوهای خوانندگی، این سیستم قابلیت‌های چشمگیری داره. می‌تونه با سبک‌های مختلف موسیقی کار کنه و حتی آهنگ‌های با زیر و بم زیاد رو هم پشتیبانی کنه. همچنین در تولید ویدیوهای سخنرانی، OmniHuman تونسته مشکل حرکات دست رو که چالش بزرگی برای سیستم‌های موجود بوده، به خوبی حل کنه و حرکات طبیعی و واقع‌گرایانه‌ای تولید کنه.

یکی از نکات جالب توجه در مورد OmniHuman، تنوع ورودی‌های قابل پذیرش اون هست. این سیستم نه تنها با تصاویر معمولی انسان‌ها کار می‌کنه، بلکه می‌تونه با تصاویر کارتونی، اشیاء مصنوعی و حتی حیوانات هم کار کنه. در هر مورد، سیستم می‌تونه ویژگی‌های حرکتی متناسب با سبک اون تصویر رو حفظ کنه و انیمیشن‌های متناسبی تولید کنه.

نکته مهمی که باید در نظر داشت اینه که برای تولید اکثر ویدیوها، فقط به یک تصویر و یک فایل صوتی نیاز هست.

نسخه کامل وایت پیپر این فریمورک رو میتونید از اینجا مشاهده کنید.

@aipulse24
تشویق مدل به فکر کردن بیشتر، تنها با اضافه کردن Wait به دستور!

محققان دانشگاه استنفورد یک روش جدید برای بهینه‌سازی مدل‌های زبانی معرفی کردن. این روش که s1 نام داره، با استفاده از فقط ۱۰۰۰ نمونه آموزشی و یک تکنیک ساده به نام budget forcing تونسته عملکردی مشابه مدل‌های بزرگ OpenAI مثل o1 به دست بیاره. نکته مهم اینجاست که اکثر مدل‌های موفق در این حوزه مثل DeepSeek r1 از داده‌های آموزشی خیلی بیشتری (حدود ۸۰۰ برابر) استفاده می‌کنن.

محققان استنفورد برای انتخاب این ۱۰۰۰ نمونه از سه معیار اصلی استفاده کردن: کیفیت (داده‌های با فرمت مناسب و بدون خطا)، سختی (مسائلی که مدل‌های پایه نمی‌تونن حل کنن) و تنوع (پوشش حوزه‌های مختلف از ریاضیات تا فیزیک و علوم کامپیوتر). این انتخاب هوشمندانه باعث شده که با وجود حجم کم داده‌های آموزشی، مدل بتونه عملکرد خوبی داشته باشه.

تکنیک budget forcing که در این تحقیق معرفی شده، یک روش ساده اما موثر برای کنترل زمان فکر کردن مدل هست. این تکنیک به دو روش عمل می‌کنه: اول اینکه اگر مدل بیش از حد مشخصی فکر کنه، به طور خودکار پردازش متوقف می‌شه و مدل مجبور به ارائه پاسخ می‌شه. دوم اینکه اگر بخوایم مدل بیشتر فکر کنه، با اضافه کردن کلمه "Wait" به زنجیره استدلال، مدل تشویق می‌شه تا بیشتر روی مسئله تمرکز کنه.

در آزمون‌های مختلف، مدل s1-32B عملکرد قابل توجهی داشته. برای مثال در آزمون‌های ریاضی AIME24 به دقت ۵۶.۷ درصد و در MATH500 به دقت ۹۳ درصد رسیده. همچنین در سوالات علمی سطح دکترا (GPQA Diamond) به دقت ۵۹.۶ درصد دست پیدا کرده که نشون می‌ده این مدل می‌تونه با مدل‌های بزرگ‌تر رقابت کنه.

نکته جالب دیگه اینه که کل فرآیند آموزش این مدل فقط ۲۶ دقیقه روی ۱۶ کارت H100 طول کشیده که در مقایسه با مدل‌های مشابه که نیاز به روزها و هفته‌ها آموزش دارن، بسیار کمتره. این نشون می‌ده که با روش‌های هوشمندانه می‌شه به جای افزایش حجم داده و زمان محاسبات، به نتایج مشابه یا حتی بهتری رسید.

محققان همچنین نشون دادن که با افزایش زمان فکر کردن مدل در زمان استفاده (test-time)، دقت پاسخ‌ها بهبود پیدا می‌کنه. برای مثال در AIME24، وقتی به مدل اجازه داده شد تا ۶ بار بیشتر فکر کنه، دقت از ۵۰ درصد به ۵۷ درصد افزایش پیدا کرد. این نشون می‌ده که حتی بعد از آموزش هم می‌شه با تنظیم پارامترهای اجرا، عملکرد مدل رو بهبود داد.

نسخه کامل این مقاله رو میتونید از اینجا مشاهده کنید.

@aipulse24
2025/02/27 08:37:47
Back to Top
HTML Embed Code: