OpenAI سرانجام از از مدل GPT-5 رونمایی کرد؛ پیشرفته ترین مدل هوش مصنوعی این شرکت که با هدف انجام وظایف پیچیده و ارائه پاسخ های دقیق تر معرفی شده و از امروز به عنوان مدل پیش فرض و به صورت رایگان برای تمام کاربران ChatGPT فعال شده است. به گزارش دیجیاتو، سم آلتمن، مدیرعامل OpenAI، در رویداد معرفی این محصول، مدل GPT-5 را جهشی چشمگیر نسبت به مدل های قبلی این شرکت توصیف کرده است. او همچنین آن را با تجربه استفاده از اولین آیفون دارای نمایشگر رتینا مقایسه کرده است که بعد از آن کاربران تمایلی به استفاده از نسخه های قبلی نداشتند. سم آلتمن: با GPT-5 انگار درحال صحبت با یک متخصص دکترا هستید OpenAI می گوید که GPT-5 هوشمندتر و سریع تر شده و اکنون کمتر مستعد ارائه پاسخ های نادرست است. آلتمن در رابطه با پیشرفت مدل های GPT در سال های گذشته توضیح می دهد: GPT-3 مانند صحبت با یک دانش آموز دبیرستانی بود. ممکن بود جواب درستی ارائه کند پاسخ عجیب غریبی دریافت کنید. GPT-4 مثل صحبت با یک دانشجوی دانشگاه بود. اما با GPT-5 برای اولین بار واقعاً احساس خواهید کرد که در حال صحبت با یک متخصص دکترا هستید. یکی از تغییرات مهمی که با عرضه GPT-5 در رابط کاربری ChatGPT ایجاد شده، این است که دیگر مدل ها به صورت جداگانه نمایش داده نمی شود. درواقع GPT-5 با استفاده از سیستمی طراحی شده که در صورت مواجهه با پرسش های پیچیده یا دستور think hard به طور خودکار از نسخه خاصی برای استدلال استفاده می کند. نکته قابل توجه دیگر اینکه GPT-5 هم اکنون برای تمام کاربران ChatGPT در دسترس است. با این حال، مانند همیشه برای کاربران رایگان سقف نامعلومی از پرسش ها در نظر گرفته شده و پس از عبور از آن، سیستم به نسخه ضعیف تری موسوم به Mini سوییچ خواهد کرد. توسعه دهندگانی که از API استفاده می کنند نیز به سه نسخه GPT-5 ، GPT-5 nano و GPT-5 mini با قیمت های متفاوت دسترسی خواهند داشت. به طور کلی، مدل جدید سه نسخه دارد. نسخه پایه برای همه کاربران قابل استفاده است و نسخه دوم، یعنی GPT-5 Mini، زمانی فعال می شود که کاربران به سقف استفاده از نسخه عادی برسند. نسخه سوم که GPT-5 Pro نام دارد، تنها برای مشترکان طرح ماهانه 200 دلاری در دسترس خواهد بود. کاربران نسخه پلاس نیز نسبت به کاربران رایگان، زمان بیشتری می توانند از GPT-5 استفاده کنند. OpenAI همچنین چهار سبک شخصیتی جدید برای شخصی سازی نحوه پاسخ دادن ChatGPT به سوالات طراحی کرده است. این سبک ها بدبین (Cynic)، رباتیک (Robot)، شنونده (Listener) و Nerd نام دارند. علاوه براین، کاربران می توانند چت های خود را با رنگ ها بیشتر شخصی سازی کنند. بهبود عملکرد هوش مصنوعی GPT-5 آلتمن پیش بینی کرده که قابلیت های کدنویسی GPT-5 آغازگر عصر جدیدی باشد که از آن به عنوان نرم افزار برحسب تقاضا یاد کرده است. در تست های OpenAI، این مدل در بنچمارک های SWE-Bench ،SWE-Lancer و Aider Polyglot عملکرد بهتری نسبت به سایر مدل ها داشته است. مایکل ترول ، هم بنیان گذار و مدیرعامل شرکت Cursor، می گوید: GPT-5 هوشمندترین مدل برای کدنویسی است که تابه حال استفاده کرده ایم. تیم ما متوجه شده که GPT-5 فوق العاده باهوش است، هدایت آن آسان است و حتی شخصیتی دارد که در هیچ کدام از مدل های دیگر وجود ندارد. این مدل نه تنها قادر است اشکالات پیچیده و عمیق را شناسایی کند، بلکه می تواند برنامه های پیچیده و چند مرحله ای را تا انتها اجرا کند؛ مشکلی که قبلاً مدل های دیگر قادر به حل آن نبودند. اکنون GPT-5 به مدل اصلی روزانه ما برای هر چیزی از تعریف و برنامه ریزی برای PR تا تکمیل ساختارهای پایانی تبدیل شده است. در آزمون SWE-bench Verified که عملکرد مدل در وظایف کدنویسی را ارزیابی می کند، GPT-5 در اولین تلاش خود امتیاز 74.9 درصد را کسب کرده است. با این وجود یعنی عملکرد GPT-5 نسبت به مدل جدید Claude Opus 4.1 از انتروپیک (با امتیاز 74.5 درصد) و جمینای 2.5 پرو از گوگل (با امتیاز 59.6 درصد) بهتر بوده است. یان دوبوا ، رییس تیم پس از آموزش مدل در OpenAI، در جریان نشست خبری، از GPT-5 خواست تا یک وب سایت آموزشی برای یادگیری زبان فرانسوی به همراه یک بازی تعاملی طراحی کند. مدل هوش مصنوعی GPT-5 در عرض چند ثانیه صدها خط کد تولید کرد و رابط کاربری وب سایت را نمایش داد. او سپس درحالی که فعالیت های خود را صفحه نمایش در زوم نمایش داده، روی بخش های مختلفی از پروژه کار کرده است. در آزمون Humanity’s Last Exam که عملکرد مدل های هوش مصنوعی در ریاضیات ، علوم انسانی و علوم طبیعی را بررسی می کند، GPT-5 Pro امتیاز 42 درصد را کسب کرده که کمی کمتر از امتیاز 44.4 درصدی مدل Grok 4 Heavy از xAI است. در آزمون GPQA Diamond، که سوالات علمی سطح دکتری را از مدل می پرسد، GPT-5 Pro در اولین تلاش خود امتیاز 89.4 درصد را کسب کرده، که بهتر از مدل های Claude Opus 4.1 و Grok 4 Heavy است. OpenAI همچنین می گوید بیش از پنج هزار تست انجام داده تا از امنیت مدل GPT-5 اطمینان داشته باشد. الکس بیوتل ، مدیر تحقیقات ایمنی GPT-5 می گوید تمرکز اصلی آنها دروغگویی مدل به کاربران بوده است. او می گوید نرخ ارائه اطلاعات نادرست این مدل نسبت به o3 کاهش یافته است. نکته قابل توجه دیگری که OpenAI به آن اشاره کرده این است که GPT-5 حالا بهتر می تواند ناتوانی خود در پاسخ به برخی سوال ها را تشخیص دهد. با این ویژگی، ChatGPT در مواردی که نتواند کاری را انجام دهد، این موضوع را صادقانه به کاربر اعلام می کند. این ویژگی قرار است اعتماد کاربران را افزایش دهد. با این حال، OpenAI جزییاتی از داده هایی که برای آموزش GPT-5 استفاده شده، منتشر نکرده است. یکی از پیشرفت های دیگر GPT-5 در زمینه امنیت، قابلیت جدیدی با نام پاسخ های ایمن ( Safe Completions ) است. بویتل می گوید این ویژگی برای موقعیت هایی طراحی شده که تشخیص نیت سوال برای مدل می تواند دشوار باشد. برای مثال اگر فردی از مدل سوال کند که برای اشتعال یک ماده چه مقدار انرژی نیاز است، ممکن است این فرد از نظر علمی کنجکاو یا یک فرد خراب کار باشد. GPT-5 با وجود قابلیت Safe Completions در چنین مواردی می تواند اطلاعات کلی و بی خطر را ارائه کند. در زمینه سلامت نیز GPT-5 بهبود یافته و بهتر از قبل می تواند نگرانی های سلامت را شناسایی کرده، پیشنهادهایی برای مراجعه به پزشک بدهد و پاسخ هایی دقیق تر و متناسب با سطح دانش و موقعیت جغرافیایی فرد ارائه کند. OpenAI می گوید در آزمون HealthBench Hard Hallucinations ، که دقت مدل ها در پاسخ به موضوعات بهداشتی را می سنجد، نرخ ارائه اطلاعات غلط GPT-5 تنها 1.6 درصد بوده که بسیار کمتر از مدل های قبلی OpenAI مانند GPT-4o و o3 است. |