شرکت‌های فناور به دنبال مدل‌های کوچک‌تر هوش مصنوعی هستند

بسیاری از توسعه‌دهندگان فناوری تمایل دارند تا از نمونه‌های کوچک‌تر مدل‌های هوش مصنوعی استفاده کنند. این گزارش به بررسی دلایل این تمایل می‌پردازد.

شرکت «اوپن‌ای‌آی»(OpenAI) روز پنجشنبه GPT-4o mini را معرفی کرد که نسخه کوچک‌تر و ارزان‌تر مدل هوش مصنوعی GPT-4o آن است.

به نقل از فست کمپانی، اوپن‌ای‌آی یکی از چندین شرکت‌ هوش مصنوعی است که نسخه‌ای از بهترین مدل بنیادین خود را توسعه داده تا مقداری از هوش را با سرعت و مقرون‌به‌صرفه شدن عوض ‌کند. چنین مبادله‌ای می‌تواند به توسعه‌دهندگان بیشتری امکان دهد تا برنامه‌های خود را با هوش مصنوعی تقویت کنند و شاید در آینده روزنه‌های جدیدی را برای برنامه‌های پیچیده‌تر باز کند.

بزرگ‌ترین مدل‌های زبانی بزرگ از میلیاردها یا تریلیون‌ها پارامتر استفاده می‌کنند تا طیف گسترده‌ای را از استدلال و وظایف مرتبط با پرس‌وجو انجام دهند. آنها با حجم بزرگی از داده‌ها آموزش دیده‌اند که موضوعات گوناگونی را پوشش می‌دهند. از سوی دیگر، مدل‌های زبانی کوچک فقط از میلیون‌ها یا ده‌ها میلیون پارامتر برای انجام دادن وظایف کمی استفاده می‌کنند و به قدرت محاسباتی کمتر و مجموعه کوچک‌تری از داده‌های آموزشی متمرکز نیاز دارند.

اخبار مرتبط

برای توسعه‌دهندگانی که برنامه‌های ساده‌تری دارند، مدل‌های زبانی کوچک ممکن است تنها گزینه قابل اجرا باشند. اوپن‌ای‌آی می‌گویدGPT-4o mini تا ۶۰ درصد ارزان‌تر از GPT-3.5 Turbo است که پیش از این مقرون‌به‌صرفه‌ترین مدل این شرکت برای توسعه‌دهندگان بود.

یک مورد دیگر، بحث سرعت است. بسیاری از کاربردهای هوش مصنوعی به دانش عمومی گسترده یک مدل زبانی بزرگ نیاز ندارند. آنها ممکن است به پاسخ‌های سریع‌تری برای پرسش‌های ساده‌تر نیاز داشته باشند. «مایک اینتراتور»(Mike Intrator)

مدیرعامل «کورویو»(CoreWeave) که میزبان مدل‌های هوش مصنوعی در فضای ابری است، گفت: منظور از تأخیر، زمان مورد نیاز برای یک برنامه هوش مصنوعی به منظور دریافت پاسخ از یک مدل در فضای ابری است. اگر فرزند من مقاله ترم خود را با کمک هوش مصنوعی بنویسد، تأخیر مشکل بزرگی نیست اما اگر بخواهد از آن برای جراحی یا رانندگی خودران استفاده کند، تأخیر با تأثیر بسیار بیشتری همراه می‌شود.

اینتراتور خاطرنشان کرد: مدل‌های مورد استفاده در خودروهای خودران باید به اندازه‌ای کوچک باشند که روی یک تراشه رایانه‌ای اجرا شوند، نه در یک سرور فضای ابری.

مدل GPT-4o mini کوچک‌تر از مدل‌های دیگر است اما هنوز آن قدر کوچک نیست که روی دستگاهی مانند تلفن همراه یا کنسول بازی اجرا شود. بنابراین، باید مانند سایر مدل‌های شرکت اوپن‌ای‌آی روی یک سرور در فضای ابری اجرا شود.

کلید نسل بعدی برنامه‌های هوش مصنوعی

«رابرت نیشیهارا»(Robert Nishihara) یکی از بنیان‌گذاران و مدیرعامل شرکت «انی‌اسکیل» (Anyscale) گفت: امروزه بیشتر برنامه‌های کاربردی مبتنی بر هوش مصنوعی شامل یک پرس‌وجو یا چند پرس‌وجو برای مدلی هستند که در فضای ابری اجرا می‌شود اما برنامه‌های پیشرفته به پرس‌وجوهای زیادی برای مدل‌های گوناگون نیاز دارند.

به عنوان مثال، برنامه‌ای که به شما کمک می‌کند یک اقامت‌گاه اجاره‌ای را انتخاب کنید، ممکن است از یک مدل برای ایجاد معیارهای انتخاب، یک مدل دیگر برای انتخاب گزینه‌های اجاره و یک مدل دیگر برای امتیاز دادن به هر یک از آن گزینه‌ها استفاده کند. کارگردانی و سازمان‌دهی همه این پرسش‌ها یک تجارت پیچیده است.

عملکرد مدل‌ها مهم است اما سرعت و هزینه آنها نیز به یک اندازه اهمیت دارد. اوپن‌ای‌آی این موضوع را می‌داند؛ همان طور که شرکت‌هایی مانند متا و گوگل می‌دانند.

نیشیهارا ادامه داد: تلاش‌های این شرکت‌ها به منظور کوچک‌سازی مدل‌های هوش مصنوعی برای برنامه‌های پیچیده‌تر مانند دستیارهای شخصی بسیار مهم هستند.

اوپن‌ای‌آی اندازه پارامتر مدل‌های خود را فاش نمی‌کند اما مدل جدید آن احتمالا به اندازه Claude 3 Haiku شرکت «آنتروپیک»(Anthropic) و Gemini ۱.۵ Flash گوگل است.

اوپن‌ای‌آی گفت: GPT-4o mini عملکرد بهتری نسبت به مدل‌های مشابه در آزمایش‌ها دارد.

اوپن‌ای‌آی خاطرنشان کرد که توسعه‌دهندگان اپلیکیشن می‌توانند از طریق یک واسط برنامه‌نویسی کاربردی به GPT-4o mini دسترسی داشته باشند و مدل‌های جدید نیز از برنامه ChatGPT پشتیبانی می‌کنند.

منبع: ایسنا

آیا این خبر مفید بود؟

نتیجه بر اساس رای موافق و رای مخالف

https://www.pishgamfanavari.ir/fa/tiny/news-1885 کپی شد

ارسال به دیگران :

شرکت‌های فناور به دنبال مدل‌های کوچک‌تر هوش مصنوعی هستند

اخبار مرتبط

کلید نسل بعدی برنامه‌های هوش مصنوعی

نظر شما

شبکه های اجتماعی

فناوری

توانایی‌های ربات انسان‌نمای چین گسترش می‌یابد

تبدیل کربن دی‌ اکسید به مواد خام پلاستیک با یک فناوری جدید

اولین تراشه مبتنی بر نور جهان ساخته شد

تازه های علم

حرکت در مسیر ساخت کامپوزیت‌های سازگار با منابع تجدیدپذیر

توسعه مکمل‌های انسانی و دامی بر پایه خواص مخمرها

حرکت در مسیر ساخت کامپوزیت‌های سازگار با منابع تجدیدپذیر

توسعه مکمل‌های انسانی و دامی بر پایه خواص مخمرها

اگر موسیقی را با صدای بسیار بلند با هدفون گوش دهید چه اتفاقی می‌افتد؟/ ویدئو

لوازم یک «شکارچی» بعد از 6 هزارسال در این غار کشف شدند

لاک‌پشت درمعرض انقراض گالاپاگوس برای اولین‌بار در ۱۰۰ سالگی مادر شد

مهندسان ژاپنی از ربات چهارپای کاوازاکی رونمایی کرد/ ویدئو

قدیمی‌ترین تقویم خورشیدی جهان در ترکیه پیدا شد/ شاهکاری ۱۲ هزار ساله

شاید باور نکنید اما کانگوروها 3 واژن دارند

آیا اثر انگشت انسان واقعا منحصر به‌ فرد است؟

تاثیر خوردن کلاژن بر پوست چیست؟

سنگی که ۳۰ سال به عنوان نگه‌دارنده در خانه استفاده می‌شد، گنج ۱ میلیون دلاری از آب درآمد

قیمت شهاب سنگ «سریال پایتخت» چقدر است؟ کجای ایران بیشترین شهاب سنگ سقوط می‌کند و چطور بفروشیم؟

چرا زنان بیشتر از مردان عمر می‌کنند؟

درگیری هوش مصنوعی با خواندن ساعت و تقویم

تغییر لحن ناسا درباره ارسال اولین زن و فرد رنگین پوست به کره ماه

قدرتمندترین سلاح آمریکا چیست؟

جزئیات تازه‌ از جنگنده نسل ششم چین

گرفتگی عضلات نشانه کمبود این مواد معدنی در بدن است

کشف یک زنبور باستانی ‌متعلق به عصر دایناسورها که ۹۹ میلیون سال پیش در صمغ یک درخت به دام افتاده بود

برخورد موج‌های عظیم به کشتی کروز/ ویدئو

وب گردی