انتشار مدل هوش مصنوعی Gemini گوگل. گوگل می گوید که پیشرفته ترین نسخه از مدل تازه راه اندازی شده هوش مصنوعی خود، Gemini Ultra، می تواند در آزمایش های خاص از متخصصان انسانی پیشی بگیرد. گوگل با راه اندازی Gemini، یک مدل زبان بزرگ که آن را «تواناترین» تا به امروز می نامید. با رایانیوز همراه باشید.
گوگل چیزی را که می تواند یک جهش قابل توجه به جلو در رقابت هوش مصنوعی باشد، انجام داد. Gemini که با استفاده از تراشههای هوش مصنوعی گوگل توسعه یافته است. میتواند اطلاعات را از منابع ویدئویی، متنی، تصویری و صوتی پردازش کند و قادر به استدلال پیچیده و درک تفاوتهای ظریف است. این شرکت انتشارات هوش مصنوعی خود را تسریع کرده است تا بتواند به رقبای خود از جمله OpenAI برسد.
در حالی که ChatGPT در کانون توجه قرار گرفته است، هوش مصنوعی Gemini بی سر و صدا زرادخانه خود را ساخته است و منتظر لحظه مناسب برای حمله است. و موفق شد، رگباری از معیارهای چشمگیر را رها کرد که اساس چشم انداز هوش مصنوعی را متزلزل کرده است. گوگل در سال گذشته بی سر و صدا از حاشیه مشاهده کرده است که ChatGPT OpenAI جهان را طوفانی کرده است. اما اکنون، نوبت گوگل است که بدرخشد. با معرفی Gemini، یک مدل پیشگامانه هوش مصنوعی، گوگل فقط وارد عرصه هوش مصنوعی نمی شود، بلکه قصد دارد آن را دوباره تعریف کند.
داغ ترین اخبار هوش مصنوعی را در رایانیوز بخوانید.
Gemini چیست
با انتشار مدل هوش مصنوعی Gemini گوگل لازم است با این مدل بیشتر آشنا شویم.
MMLU (Massive Multitask Language Understanding)، یکی از محبوب ترین روش ها برای آزمایش دانش و توانایی های حل مسئله مدل های هوش مصنوعی، است. Gemini گوگل اولین مدلی است که در MMLU، از متخصصان انسانی پیشی گرفته است.
به گفته گوگل، قدرتمندترین نسخه Gemini AI در بیش از 30 مورد از 32 (حدود 90٪) معیارهای آکادمیک، از جمله 10 مورد از 12 معیار محبوب متن و استدلال، 9 از 9 معیار درک تصویر، 6 از 6 درک ویدیو، و 5 از 5 معیار تشخیص گفتار و ترجمه گفتار از ChatGPT بهتر است.
Gemini از ابتدا به صورت چندوجهی ساخته شده است. به این معنی که می تواند متن، صدا، عکس، ویدیو و کد را درک کند و بین آن جابجا شود. موارد استفاده بالقوه زیادی وجود دارد، از ایده پردازی و ایجاد محصول گرفته تا تحقیق و کمک ترجمه.
صحبت مدیر عامل گوگل، درباره راه اندازی Gemini
ساندار پیچای، مدیر عامل گوگل، با راه اندازی Gemini، پیشرفته ترین مدل زبان بزرگ آنها (LLM) جسورانه ورود “عصر جدیدی از هوش مصنوعی” را اعلام کرد. Gemini دارای «قابلیتهای استدلال» عالی است که به آن اجازه میدهد با دقت و عمق بیشتری به سؤالات پیچیده رسیدگی کند. خطر «توهمات» را که سایر مدلهای هوش مصنوعی از جمله مدل خود گوگل را آزار داده است، به حداقل برساند. این پیشرفت راه را برای نسل جدیدی از هوش مصنوعی که قادر به انجام فرآیندهای فکری هوشمندانه و ظریف است، هموار می کند.
انتشار Gemini
انتشار مدل هوش مصنوعی Gemini گوگل. گوگل مدل هوش مصنوعی مولد خود را که مدت ها انتظارش را می کشید، Gemini منتشر کرد. این شرکت به عنوان قدرتمندترین در نوع خود آنرا تبلیغ می کند. این برنامه واقعاً چشمگیر است و متن، صدا، ویدیو، کد و موارد دیگر را ترکیب می کند. علیرغم همه اینها، عرضه Gemini بیشتر شبیه به آخرین عرضه محصول در جنگهای مک در برابر رایانههای شخصی است. نشان میدهد که چگونه هوش مصنوعی مولد، حداقل در مرحله فعلیاش، بیشتر یک رقابت شرکتی است تا ایجاد تحولات اجتماعی. حتی نسخههای این مدل – Nano، Pro و Ultra – مانند کرایه استاندارد Silicon Valley نامگذاری شدهاند.
هزینه Gemini
سیسی هسیائو، نایب رئیس Bard گوگل، در یک کنفرانس مطبوعاتی گفت که در حال بررسی چگونگی کسب درآمد از Gemini است.
نسخه های مدل Gemini
Google Gemini Nano
گوگل Gemini Nano برای کارهای خاص و دستگاه های تلفن همراه استفاده خواهد کرد.
مدل “لایت” کاهش یافته LLM است که در دو اندازه موجود است: Nano-1 (1.8 میلیارد پارامتر) و Nano-2 (3.25 میلیارد پارامتر).
این نسخه از Gemini برای اجرا بر روی دستگاه های تلفن همراه طراحی شده است و به زودی در برنامه AI Core گوگل از طریق اندروید 14 در برنامه Pixel 8 Pro پیش نمایش خواهد شد. اگرچه نانو منحصر به پیکسل 8 پرو است، در حال حاضر، توسعه دهندگان می توانند برای نگاهی گذرا به این فناوری درخواست دهند.
Nano ویژگیهای مختلفی را که Google در طول رونمایی از Pixel 8 Pro در ماه اکتبر پیشنمایش کرده است، مانند خلاصهسازی در برنامه Record و پاسخهای پیشنهادی برای برنامههای پیامرسان، تقویت میکند.
Google Gemini Pro
Gemini Pro، در طیف گسترده ای از وظایف مقیاس می شود. Bard اکنون توسط Gemini Pro، یکی از سه لایه سیستم هوش مصنوعی، که این شرکت به عنوان “بزرگترین ارتقاء” چت بات از زمان راه اندازی آن توصیف می کند، پشتیبانی می شود.
بر روی مراکز داده گوگل اجرا می شود و چیزهایی مانند Google Bard، ربات چت مشابه راه حل Copilot مایکروسافت را تقویت می کند. به زودی در سایر ابزارهای Google مانند Duet AI، Google Chrome، Google Ads و تجربه جستجوی مولد Google نیز عرضه خواهد شد.
Google Gemini Pro در 13 دسامبر برای مشتریانی که از Vertex AI (پلتفرم یادگیری ماشینی با مدیریت کامل گوگل) استفاده می کنند، راه اندازی می شود. همچنین در آینده در مجموعه توسعه دهندگان هوش مصنوعی مولد گوگل ادغام خواهد شد.
به گفته گوگل، Gemini Pro در کارهایی مانند طوفان فکری، نوشتن، و خلاصه کردن محتوا موثرتر است – عملکرد بهتری از OpenAI GPT-3.5 در شش معیار اصلی دارد.
Google Gemini Ultra
Gemini Ultra Gemini Ultra پیشرفته ترین مدل گوگل، در هفت مورد از هشت معیار، GPT-4 جدیدتر را شکست داد.
ظاهراً در طیف گستردهای از معیارهای آکادمیک، نتایج پیشرفته فعلی را شکست میدهد، و «با امتیاز 90.0 درصد، Gemini Ultra اولین مدلی است که از متخصصان انسانی در MMLU عملکرد بهتری دارد».
که هنوز برای استفاده گسترده در این مرحله در دسترس نیست، تواناترین مدل این مجموعه است. مانند Pro، برای چندوجهی بودن بومی آموزش دیده است و از قبل آموزش داده شده و بر روی پایه های کد مختلف تنظیم شده است.
Gemini Ultra می تواند اطلاعات ظریف متنی، کد و صدا را درک کند و به سوالات مرتبط با موضوعات پیچیده پاسخ دهد. Ultra در حدود 30 معیار از 32 معیار پرکاربرد مورد استفاده برای توسعه LLM از نتایج پیشرفته فعلی فراتر رفته است.
گوگل جمینی چقدر قدرتمند است؟
از زمانی که گوگل برای اولین بار ورود قریب الوقوع جمینی را اعلام کرد، تحلیلگران تلاش کردند تا پیش بینی کنند که چقدر می تواند قدرتمند باشد. ما در نهایت برخی از داده های واقعی به اشتراک گذاشته شده توسط Google در آخرین “گزارش فنی Gemini” داریم.
تیم هوش مصنوعی گفت که آنها در چند ماه گذشته مدل های Gemini خود را به دقت آزمایش کرده اند و عملکرد آنها را در کارهای مختلف ارزیابی می کنند. اگرچه بینش در مورد عملکرد Gemini Nano و Gemini Pro محدود است، دادههای زیادی برای پیشنهاد رقبای Ultra bulldoze LLM وجود دارد.
با امتیاز حدود 90 درصد، Gemini Ultra اولین راه حلی است که قادر است در تست های Massive Multitask Language Understanding (MMLU) از متخصصان انسانی پیشی بگیرد. این آزمون ها از ترکیب 57 موضوع مختلف مانند فیزیک، ریاضی، تاریخ و اخلاق برای بررسی دانش دنیای واقعی و قابلیت های حل مسئله استفاده می کنند.
به گفته این تیم، رویکرد معیار جدید گوگل به MMLU به این معنی است که Gemini می تواند از توانایی های استدلال خود برای “دقت بیشتر” قبل از پاسخ دادن به سوالات استفاده کند.
Gemini Ultra همچنین امتیاز پیشرفته 59.4٪ را در معیار جدید MMMU به دست آورد. این معیار به عملکرد LLM ها در کارهای چندوجهی که نیاز به استدلال عمدی دارند می پردازد.
گوگل میگوید Gemini Ultra بدون کمک تشخیص کاراکتر شی از دیگر مدلهای پیشرو بهتر عمل کرد و قابلیتهای چندوجهی بومی راهحل را برجسته کرد.
این لزوماً به این معنی نیست که Google Gemini از مشکلات مشابهی که سایر مدلهای زبان با آن مواجه هستند، مانند توهم هوش مصنوعی رنج نمیبرد. حتی بهترین مدلهای هوش مصنوعی مولد نیز میتوانند در صورت درخواست به روشهای خاص، بهطور مشکلساز پاسخ دهند.
آیا Gemini بهتر از GPT است؟
با افزایش تقاضا برای راه حل های هوش مصنوعی و مدل های LLM، گوگل رقابت زیادی در بازار فعلی دارد. هزاران مدل جدید و جدید می توانند عملکرد بهتری از Gemini داشته باشند، به خصوص اگر به تکامل خود ادامه دهند، مانند Falcon 180B.
با این حال، بسیاری از علاقه مندان به فناوری تنها به یک سوال پاسخ می دهند: “آیا بهتر از GPT-4 است؟” GPT-4، مدل زبان بزرگ چندوجهی OpenAI، تقریباً معیاری است که همه توسعه دهندگان برای ارزیابی پتانسیل LLM های جدید از آن استفاده می کنند.
به گفته گوگل، GPT-4 تنها در یک زمینه به نام «استدلال HellaSwag» بهتر از Gemini عمل میکند. این همان استدلال عامیانه ای است که برای کارهای روزمره استفاده می شود. GPT-4 در این زمینه امتیاز 95.3 درصد را به دست آورد، در حالی که جمینی 87.8 درصد است.
دیدگاهتان را بنویسید