اوپنایآی از GPT-4.5 رونمایی کرد
اوپنایآی به تازگی از GPT-4.5 رونمایی کرده که بهبودهایی در مکالمات طبیعی و درک بهتر منظور کاربران دارد. این مدل با کاهش پاسخهای ساختگی و عملکرد بهتر در آزمونهای عمومی، تجربهای پیشرفتهتر از مدلهای قبلی ارائه میدهد.
اوپنایآی به تازگی از GPT-4.5، نسخه جدید و ارتقا یافته مدل زبانی بزرگ خود رونمایی کرده است. این شرکت ادعا میکند که این مدل، بزرگترین و بهترین مدل چت همهجانبهای است که تاکنون ارائه کردهاند. میا گلیس، دانشمند تحقیقاتی در اوپنایآی، میگوید: «این واقعاً یک گام رو به جلو برای ما محسوب میشود.»
با توجه به عرضه مدلهای استدلالی o1 و o3، اوپنایآی به نظر میرسد دو خط تولید محصول را به طور همزمان پیش میبرد. GPT-4.5 بخشی از مجموعه مدلهای غیر استدلالی است که نیک رایدر، همکار گلیس و دانشمند تحقیقاتی، آن را «نسخهای جدید در سری کلاسیک GPT» مینامد.
کاربران با اشتراک 200 دلاری ماهانه ChatGPT Pro میتوانند از امروز GPT-4.5 را تجربه کنند. اوپنایآی اعلام کرده که از هفته آینده دسترسی به این مدل برای سایر کاربران نیز آغاز خواهد شد. اوپنایآی با هر نسخه جدید از مدلهای GPT خود نشان داده که اندازه بزرگتر به معنای عملکرد بهتر است. با این حال، بحثهای زیادی در مورد رسیدن این رویکرد به محدودیتهای خود، از جمله اظهارات ایلیا سوتسکور، دانشمند ارشد سابق اوپنایآی، مطرح شده است. ادعاهای این شرکت در مورد GPT-4.5 پاسخی محکم به این منتقدان به نظر میرسد.

تمام مدلهای زبانی بزرگ الگوهای موجود در میلیاردها سند آموزشی خود را شناسایی میکنند. مدلهای کوچکتر، قواعد نحوی و اطلاعات پایه را یاد میگیرند. مدلهای بزرگتر میتوانند الگوهای خاصتری مانند نشانههای احساسی را تشخیص دهند، برای مثال، زمانی که کلمات یک گوینده نشاندهنده خصومت است. رایدر میگوید: «تمام این الگوهای ظریف که در یک مکالمه انسانی وجود دارند، همان بخشهایی هستند که این مدلهای بزرگتر و بزرگتر قادر به شناسایی آنها خواهند بود.»
گلیس میگوید: «این مدل توانایی برقراری مکالمات گرم، شهودی، طبیعی و روان را دارد. ما معتقدیم که درک قویتری از منظور کاربران دارد، به ویژه زمانی که انتظارات آنها ضمنیتر است، که منجر به پاسخهای ظریف و متفکرانهتر میشود.»
رایدر در ادامه افزود: «ما تا حدودی میدانیم که موتور این مدل چگونه کار میکند، و اکنون تمرکز ما روی بهینهسازی عملکرد آن است. این امر عمدتاً شامل افزایش مقیاس محاسبات، افزایش مقیاس دادهها، یافتن روشهای آموزشی کارآمدتر و در نهایت، پیشبرد مرزهای دانش است.»
اوپنایآی به طور دقیق اندازه مدل جدید خود را اعلام نکرده است. اما گفته که جهش در مقیاس از GPT-4o به GPT-4.5 مشابه جهش از GPT-3.5 به GPT-4o است. کارشناسان تخمین زدهاند که GPT-4 میتواند تا 1.8 تریلیون پارامتر داشته باشد، مقادیری که در طول آموزش مدل تنظیم میشوند.
GPT-4.5 با تکنیکهایی مشابه با مدل قبلی خود، GPT-4o، از جمله تنظیم دقیق تحت نظارت انسانی و یادگیری تقویتی با بازخورد انسانی، آموزش داده شده است. رایدر میگوید: «کلید ایجاد سیستمهای هوشمند، دستورالعملی است که سالهاست از آن پیروی میکنیم. و آن یافتن الگوهای مقیاسپذیری است که بتوانیم منابع بیشتری را به آنها تزریق کنیم تا سیستمهای هوشمندتری را دریافت کنیم.»
برخلاف مدلهای استدلالی مانند o1 و o3، که پاسخها را به صورت گام به گام ارائه میکنند، مدلهای زبانی بزرگ معمولی مانند GPT-4.5 اولین پاسخی را که به ذهنشان میرسد، ارائه میدهند. اما GPT-4.5 کاربردهای عمومیتری دارد. در آزمایش SimpleQA، یک نوع آزمون دانش عمومی که توسط اوپنایآی در سال گذشته توسعه داده شد و شامل سوالاتی در زمینههای مختلف از علم و فناوری تا برنامههای تلویزیونی و بازیهای ویدیویی است، GPT-4.5 امتیاز 62.5% را کسب کرد، در حالی که امتیاز GPT-4o 38.6% و امتیاز o3-mini 15% بود.
علاوه بر این، اوپنایآی ادعا میکند که GPT-4.5 پاسخهای ساختگی (معروف به توهم) بسیار کمتری ارائه میدهد. در همان آزمون، GPT-4.5 در 37.1% از موارد پاسخهای ساختگی ارائه کرد، در حالی که این رقم برای GPT-4o 59.8% و برای o3-mini 80.3% بود. اما SimpleQA تنها یک معیار است. در سایر آزمایشها، از جمله MMLU، یک معیار رایجتر برای مقایسه مدلهای زبانی بزرگ، پیشرفت نسبت به مدلهای قبلی اوپنایآی حاشیهای بود. و در معیارهای استاندارد علم و ریاضیات، امتیاز GPT-4.5 از o3 کمتر بود.
به نظر میرسد جذابیت خاص GPT-4.5 در مکالمه آن است. آزمایشکنندگان انسانی استخدام شده توسط اوپنایآی گفتهاند که GPT-4.5 را برای پرسشهای روزمره، پرسشهای حرفهای و وظایف خلاقانه، از جمله سرودن شعر، به GPT-4o ترجیح میدهند.