اوپن‌ای‌آی از GPT-4.5 رونمایی کرد

اوپن‌ای‌آی به تازگی از GPT-4.5 رونمایی کرده که بهبودهایی در مکالمات طبیعی و درک بهتر منظور کاربران دارد. این مدل با کاهش پاسخ‌های ساختگی و عملکرد بهتر در آزمون‌های عمومی، تجربه‌ای پیشرفته‌تر از مدل‌های قبلی ارائه می‌دهد.

۱۱ اسفند ۱۴۰۳

تبلیغات

اوپن‌ای‌آی به تازگی از GPT-4.5، نسخه جدید و ارتقا یافته مدل زبانی بزرگ خود رونمایی کرده است. این شرکت ادعا می‌کند که این مدل، بزرگ‌ترین و بهترین مدل چت همه‌جانبه‌ای است که تاکنون ارائه کرده‌اند. میا گلیس، دانشمند تحقیقاتی در اوپن‌ای‌آی، می‌گوید: «این واقعاً یک گام رو به جلو برای ما محسوب می‌شود.»
با توجه به عرضه مدل‌های استدلالی o1 و o3، اوپن‌ای‌آی به نظر می‌رسد دو خط تولید محصول را به طور همزمان پیش می‌برد. GPT-4.5 بخشی از مجموعه مدل‌های غیر استدلالی است که نیک رایدر، همکار گلیس و دانشمند تحقیقاتی، آن را «نسخه‌ای جدید در سری کلاسیک GPT» می‌نامد.

کاربران با اشتراک 200 دلاری ماهانه ChatGPT Pro می‌توانند از امروز GPT-4.5 را تجربه کنند. اوپن‌ای‌آی اعلام کرده که از هفته آینده دسترسی به این مدل برای سایر کاربران نیز آغاز خواهد شد. اوپن‌ای‌آی با هر نسخه جدید از مدل‌های GPT خود نشان داده که اندازه بزرگ‌تر به معنای عملکرد بهتر است. با این حال، بحث‌های زیادی در مورد رسیدن این رویکرد به محدودیت‌های خود، از جمله اظهارات ایلیا سوتسکور، دانشمند ارشد سابق اوپن‌ای‌آی، مطرح شده است. ادعاهای این شرکت در مورد GPT-4.5 پاسخی محکم به این منتقدان به نظر می‌رسد.

تمام مدل‌های زبانی بزرگ الگوهای موجود در میلیاردها سند آموزشی خود را شناسایی می‌کنند. مدل‌های کوچک‌تر، قواعد نحوی و اطلاعات پایه را یاد می‌گیرند. مدل‌های بزرگ‌تر می‌توانند الگوهای خاص‌تری مانند نشانه‌های احساسی را تشخیص دهند، برای مثال، زمانی که کلمات یک گوینده نشان‌دهنده خصومت است. رایدر می‌گوید: «تمام این الگوهای ظریف که در یک مکالمه انسانی وجود دارند، همان بخش‌هایی هستند که این مدل‌های بزرگ‌تر و بزرگ‌تر قادر به شناسایی آن‌ها خواهند بود.»

گلیس می‌گوید: «این مدل توانایی برقراری مکالمات گرم، شهودی، طبیعی و روان را دارد. ما معتقدیم که درک قوی‌تری از منظور کاربران دارد، به ویژه زمانی که انتظارات آن‌ها ضمنی‌تر است، که منجر به پاسخ‌های ظریف و متفکرانه‌تر می‌شود.»

رایدر در ادامه افزود: «ما تا حدودی می‌دانیم که موتور این مدل چگونه کار می‌کند، و اکنون تمرکز ما روی بهینه‌سازی عملکرد آن است. این امر عمدتاً شامل افزایش مقیاس محاسبات، افزایش مقیاس داده‌ها، یافتن روش‌های آموزشی کارآمدتر و در نهایت، پیشبرد مرزهای دانش است.»

اوپن‌ای‌آی به طور دقیق اندازه مدل جدید خود را اعلام نکرده است. اما گفته که جهش در مقیاس از GPT-4o به GPT-4.5 مشابه جهش از GPT-3.5 به GPT-4o است. کارشناسان تخمین زده‌اند که GPT-4 می‌تواند تا 1.8 تریلیون پارامتر داشته باشد، مقادیری که در طول آموزش مدل تنظیم می‌شوند.

GPT-4.5 با تکنیک‌هایی مشابه با مدل قبلی خود، GPT-4o، از جمله تنظیم دقیق تحت نظارت انسانی و یادگیری تقویتی با بازخورد انسانی، آموزش داده شده است. رایدر می‌گوید: «کلید ایجاد سیستم‌های هوشمند، دستورالعملی است که سال‌هاست از آن پیروی می‌کنیم. و آن یافتن الگوهای مقیاس‌پذیری است که بتوانیم منابع بیشتری را به آن‌ها تزریق کنیم تا سیستم‌های هوشمندتری را دریافت کنیم.»
برخلاف مدل‌های استدلالی مانند o1 و o3، که پاسخ‌ها را به صورت گام به گام ارائه می‌کنند، مدل‌های زبانی بزرگ معمولی مانند GPT-4.5 اولین پاسخی را که به ذهنشان می‌رسد، ارائه می‌دهند. اما GPT-4.5 کاربردهای عمومی‌تری دارد. در آزمایش SimpleQA، یک نوع آزمون دانش عمومی که توسط اوپن‌ای‌آی در سال گذشته توسعه داده شد و شامل سوالاتی در زمینه‌های مختلف از علم و فناوری تا برنامه‌های تلویزیونی و بازی‌های ویدیویی است، GPT-4.5 امتیاز 62.5% را کسب کرد، در حالی که امتیاز GPT-4o 38.6% و امتیاز o3-mini 15% بود.

علاوه بر این، اوپن‌ای‌آی ادعا می‌کند که GPT-4.5 پاسخ‌های ساختگی (معروف به توهم) بسیار کمتری ارائه می‌دهد. در همان آزمون، GPT-4.5 در 37.1% از موارد پاسخ‌های ساختگی ارائه کرد، در حالی که این رقم برای GPT-4o 59.8% و برای o3-mini 80.3% بود. اما SimpleQA تنها یک معیار است. در سایر آزمایش‌ها، از جمله MMLU، یک معیار رایج‌تر برای مقایسه مدل‌های زبانی بزرگ، پیشرفت نسبت به مدل‌های قبلی اوپن‌ای‌آی حاشیه‌ای بود. و در معیارهای استاندارد علم و ریاضیات، امتیاز GPT-4.5 از o3 کمتر بود.

به نظر می‌رسد جذابیت خاص GPT-4.5 در مکالمه آن است. آزمایش‌کنندگان انسانی استخدام شده توسط اوپن‌ای‌آی گفته‌اند که GPT-4.5 را برای پرسش‌های روزمره، پرسش‌های حرفه‌ای و وظایف خلاقانه، از جمله سرودن شعر، به GPT-4o ترجیح می‌دهند.

تبلیغات