مدل زبانی بزرگ جدید GPT-4o شرکت OpenAI در جریان مراسم ویژهٔ این شرکت رونمایی شد. GPT-4o نسخهٔ اصلاحشدهٔ مدل زبانی GPT-4 است که بهعنوان قلب تپندهٔ چتبات معروف ChatGPT عمل میکند. حرف o در عبارت GPT-4o مخفف Omni به معنی عالمگیر یا جهانی است.
به گزارش مجله خانواده و به نقل از زومیت، «میرا موراتی» مدیر ارشد فناوری OpenAI در این مراسم گفت که مدل جدید این شرکت بسیار سریعتر است و درزمینهٔ درک متن و محتوای تصویری و محتوای صوتی، عملکرد چشمگیری از خود نشان میدهد.
OpenAI میگوید که مدل زبانی بزرگ GPT-4o به رایگان در دسترس همهٔ مردم قرار میگیرد، بااینحال محدودیت ظرفیت کاربران نسخهٔ اشتراکی پنج برابرِ کاربران نسخهٔ رایگان است؛ به این معنی که کاربران اشتراکی میتوانند روزانه پنج برابر درخواست بیشتر ارسال کنند.
در بخشی از مراسم OpenAI شاهد عملکرد حیرتانگیز GPT-4o در حل مسائل ریاضی و حتی درک لحن حرف زدن کاربر بودیم. قابلیت صوتی جدید GPT-4o به احساسات کاربر کاملاً واکنش نشان میدهد و با لحنی صمیمی مشغول صحبت کردن و حتی داستان گفتن میشود.
سم آلتمن، مدیرعامل OpenAI، اعلام کرد که مدل GPT-4o بهصورت ذاتی، چندحالته است؛ یعنی مدل جدید میتواند افزون بر متن، محتواهای صوتی و تصویری را تولید کند و بفهمد.
هوش مصنوعی GPT-4o مکالمات انسان و کامپیوتر را طبیعیتر میکند
توسعهدهندگانی که به GPT-4o علاقهمندند، میتوانند API این مدل هوش مصنوعی را با نصف قیمت GPT-4 Turbo خریداری کنند. جالبتر اینکه GPT-4o به میزان دو برابر سریعتر از نسخهٔ Turbo است.
بر اساس گفتهٔ OpenAI، اکثر قابلیتهای مدل هوش مصنوعی جدید این شرکت بهصورت تدریجی در دسترس قرار میگیرند؛ بااینحال قابلیتهای متنی و تصویری از همین امروز در چتبات ChatGPT در دسترس است.
مدل زبانی GPT-4o قدمی در راستای طبیعی شدن تعامل انسان با کامپیوتر است و میتواند در تنها ۲۳۲ میلیثانیه (میانگین ۳۲۰ میلیثانیه)، به ورودیهای صوتی پاسخ دهد؛ OpenAI ادعا میکند که زمان پاسخدهی GPT-4o مشابه زمان پاسخدهی انسان در مکالمات روزمره است.
GPT-4o درزمینهٔ فهم متنهای انگلیسی و کد، همسطح نسخهٔ Turbo ظاهر میشود، اما ارزانتر و بسیار سریعتر است. این مدل زبانی جدید بهطور ویژه در توانایی درک محتوای بصری و صوتی تقویت شده است.
تا پیش از انتشار GPT-4o میتوانستید از طریق قابلیت Voice Mode و با تأخیر ۲٫۸ ثانیهای در GPT-3.5 یا ۵٫۴ ثانیهای در GPT-4 با ChatGPT گفتوگو کنید؛ اما Voice Mode برای ارائهٔ این قابلیت، به سه مدل اتکا میکند: یک مدل ساده برای تبدیل صدا به متن، GPT-3.5 یا GPT-4 برای تبدیل متن به متن و درنهایت مدل سوم برای تبدیل متن به صدا.
با انتشار GPT-4o، سازوکار قابلیت صوتی ChatGPT تغییر میکند. OpenAI میگوید مدل جدیدی را توسعه داده است که بهطور کامل به متن و صدا و تصویر دسترسی دارد و سرعت بسیار بالاتری ارائه میدهد.
بر اساس گفتهٔ OpenAI، مدل هوش مصنوعی GPT-4o در کنار عملکرد سریع و دقیق، توجه ویژهای به ایمنی دارد و محتواهای حساس را تولید نمیکند.
دسترسی رایگاه به GPT Store
OpenAI تعدادی از ویژگیهای فروشگاه جیپیتی استور را که قبلاً فقط مختص مشترکین پولی بود، در دسترس کاربران رایگان خود قرار میدهد. مهمترین ویژگی، ایجاد چتباتهای سفارشی و گشتوگذار در GPT Store است.
شرکت OpenAI چهار ماه پیش در ۱۰ ژانویه (۲۰ دی)، GPT Store را برای مشترکین پولی افتتاح کرد. این فروشگاه امکان ساخت چتباتهایی به نام GPT و به اشتراکگذاری آنها را به کاربران میدهد.
درحالحاضر برخی از باتهای پرطرفدار سفارشی هوش مصنوعی شامل بات تولیدکنندهٔ تصویر، چتباتی به نام Consensus (که برای کمک به تحقیقات علمی طراحی شده) و بات سازندهٔ لوگو هستند.
OpenAI گفت که برنامهٔ اشتراک درآمد را که بر اساس تعامل است، برای سازندگان GPTها ارائه خواهد کرد که آزمایش آن در ماه مارس (اسفند و فروردین) آغاز شده است. مخاطبان باتها به دلیل محدودیت این ویژگی به کاربران اشتراک پولی محدود شده است.
ارائه نسخه دسکتاپ ChatGDP، فقط مخصوص macOS
OpenAI همچنین با معرفی اپلیکیشن دسکتاپ ChatGPT برای کاربران macOS، اعلام کرد که اپلیکیشن دسکتاپ از رابط کاربری جدیدی مشابه با نسخهٔ موبایل بهره میبرد.
میرا موراتی، مدیر ارشد فناوری OpenAI، در مراسم نشان داد که اپلیکیشن دسکتاپ ChatGPT از گفتوگوی صوتی نیز پشتیبانی میکند؛ قابلیتی که تاکنون تنها روی گوشیها در دسترس بود.
OpenAI اعلام کرد: «ما اپلیکیشن مخصوص macOS را از امروز برای کاربران سرویس پلاس منتشر میکنیم و در هفتههای آینده آن را به طور گسترده در دسترس قرار خواهیم داد. ما همچنین قصد داریم نسخهٔ مخصوص ویندوز را تا پایان ۲۰۲۴ رونمایی کنیم».
۵۴۵۴