انتشار مدل هوش مصنوعی Gemini گوگل

انتشار مدل هوش مصنوعی Gemini گوگل. گوگل می گوید که پیشرفته ترین نسخه از مدل تازه راه اندازی شده هوش مصنوعی خود، Gemini Ultra، می تواند در آزمایش های خاص از متخصصان انسانی پیشی بگیرد. گوگل با راه اندازی Gemini، یک مدل زبان بزرگ که آن را «تواناترین» تا به امروز می نامید. با رایانیوز همراه باشید.

گوگل چیزی را که می تواند یک جهش قابل توجه به جلو در رقابت هوش مصنوعی باشد، انجام داد. Gemini که با استفاده از تراشه‌های هوش مصنوعی گوگل توسعه یافته است. می‌تواند اطلاعات را از منابع ویدئویی، متنی، تصویری و صوتی پردازش کند و قادر به استدلال پیچیده و درک تفاوت‌های ظریف است. این شرکت انتشارات هوش مصنوعی خود را تسریع کرده است تا بتواند به رقبای خود از جمله OpenAI برسد.

در حالی که ChatGPT در کانون توجه قرار گرفته است، هوش مصنوعی Gemini بی سر و صدا زرادخانه خود را ساخته است و منتظر لحظه مناسب برای حمله است. و موفق شد، رگباری از معیارهای چشمگیر را رها کرد که اساس چشم انداز هوش مصنوعی را متزلزل کرده است. گوگل در سال گذشته بی سر و صدا از حاشیه مشاهده کرده است که ChatGPT OpenAI جهان را طوفانی کرده است. اما اکنون، نوبت گوگل است که بدرخشد. با معرفی Gemini، یک مدل پیشگامانه هوش مصنوعی، گوگل فقط وارد عرصه هوش مصنوعی نمی شود، بلکه قصد دارد آن را دوباره تعریف کند.

داغ ترین اخبار هوش مصنوعی را در رایانیوز بخوانید.

Gemini چیست

با انتشار مدل هوش مصنوعی Gemini گوگل لازم است با این مدل بیشتر آشنا شویم.

MMLU (Massive Multitask Language Understanding)، یکی از محبوب ترین روش ها برای آزمایش دانش و توانایی های حل مسئله مدل های هوش مصنوعی، است. Gemini گوگل اولین مدلی است که در MMLU، از متخصصان انسانی پیشی گرفته است.

به گفته گوگل، قدرتمندترین نسخه Gemini AI در بیش از 30 مورد از 32 (حدود 90٪) معیارهای آکادمیک، از جمله 10 مورد از 12 معیار محبوب متن و استدلال، 9 از 9 معیار درک تصویر، 6 از 6 درک ویدیو، و 5 از 5 معیار تشخیص گفتار و ترجمه گفتار از ChatGPT بهتر است.

Gemini از ابتدا به صورت چندوجهی ساخته شده است. به این معنی که می تواند متن، صدا، عکس، ویدیو و کد را درک کند و بین آن جابجا شود. موارد استفاده بالقوه زیادی وجود دارد، از ایده پردازی و ایجاد محصول گرفته تا تحقیق و کمک ترجمه.

صحبت مدیر عامل گوگل، درباره راه اندازی Gemini

ساندار پیچای، مدیر عامل گوگل، با راه اندازی Gemini، پیشرفته ترین مدل زبان بزرگ آنها (LLM) جسورانه ورود “عصر جدیدی از هوش مصنوعی” را اعلام کرد. Gemini دارای «قابلیت‌های استدلال» عالی است که به آن اجازه می‌دهد با دقت و عمق بیشتری به سؤالات پیچیده رسیدگی کند. خطر «توهمات» را که سایر مدل‌های هوش مصنوعی از جمله مدل خود گوگل را آزار داده است، به حداقل برساند. این پیشرفت راه را برای نسل جدیدی از هوش مصنوعی که قادر به انجام فرآیندهای فکری هوشمندانه و ظریف است، هموار می کند.

انتشار Gemini

انتشار مدل هوش مصنوعی Gemini گوگل. گوگل مدل هوش مصنوعی مولد خود را که مدت ها انتظارش را می کشید، Gemini منتشر کرد. این شرکت به عنوان قدرتمندترین در نوع خود آنرا تبلیغ می کند. این برنامه واقعاً چشمگیر است و متن، صدا، ویدیو، کد و موارد دیگر را ترکیب می کند. علی‌رغم همه این‌ها، عرضه Gemini بیشتر شبیه به آخرین عرضه محصول در جنگ‌های مک در برابر رایانه‌های شخصی است. نشان می‌دهد که چگونه هوش مصنوعی مولد، حداقل در مرحله فعلی‌اش، بیشتر یک رقابت شرکتی است تا ایجاد تحولات اجتماعی. حتی نسخه‌های این مدل – Nano، Pro و Ultra – مانند کرایه استاندارد Silicon Valley نامگذاری شده‌اند.

هزینه Gemini

سیسی هسیائو، نایب رئیس Bard گوگل، در یک کنفرانس مطبوعاتی گفت که در حال بررسی چگونگی کسب درآمد از Gemini است.

نسخه های مدل Gemini

Google Gemini Nano

گوگل Gemini Nano برای کارهای خاص و دستگاه های تلفن همراه استفاده خواهد کرد.

مدل “لایت” کاهش یافته LLM است که در دو اندازه موجود است: Nano-1 (1.8 میلیارد پارامتر) و Nano-2 (3.25 میلیارد پارامتر).

این نسخه از Gemini برای اجرا بر روی دستگاه های تلفن همراه طراحی شده است و به زودی در برنامه AI Core گوگل از طریق اندروید 14 در برنامه Pixel 8 Pro پیش نمایش خواهد شد. اگرچه نانو منحصر به پیکسل 8 پرو است، در حال حاضر، توسعه دهندگان می توانند برای نگاهی گذرا به این فناوری درخواست دهند.

Nano ویژگی‌های مختلفی را که Google در طول رونمایی از Pixel 8 Pro در ماه اکتبر پیش‌نمایش کرده است، مانند خلاصه‌سازی در برنامه Record و پاسخ‌های پیشنهادی برای برنامه‌های پیام‌رسان، تقویت می‌کند.

Google Gemini Pro

Gemini Pro، در طیف گسترده ای از وظایف مقیاس می شود. Bard اکنون توسط Gemini Pro، یکی از سه لایه سیستم هوش مصنوعی، که این شرکت به عنوان “بزرگترین ارتقاء” چت بات از زمان راه اندازی آن توصیف می کند، پشتیبانی می شود.

بر روی مراکز داده گوگل اجرا می شود و چیزهایی مانند Google Bard، ربات چت مشابه راه حل Copilot مایکروسافت را تقویت می کند. به زودی در سایر ابزارهای Google مانند Duet AI، Google Chrome، Google Ads و تجربه جستجوی مولد Google نیز عرضه خواهد شد.

Google Gemini Pro در 13 دسامبر برای مشتریانی که از Vertex AI (پلتفرم یادگیری ماشینی با مدیریت کامل گوگل) استفاده می کنند، راه اندازی می شود. همچنین در آینده در مجموعه توسعه دهندگان هوش مصنوعی مولد گوگل ادغام خواهد شد.

به گفته گوگل، Gemini Pro در کارهایی مانند طوفان فکری، نوشتن، و خلاصه کردن محتوا موثرتر است – عملکرد بهتری از OpenAI GPT-3.5 در شش معیار اصلی دارد.

Google Gemini Ultra

Gemini Ultra Gemini Ultra پیشرفته ترین مدل گوگل، در هفت مورد از هشت معیار، GPT-4 جدیدتر را شکست داد.

ظاهراً در طیف گسترده‌ای از معیارهای آکادمیک، نتایج پیشرفته فعلی را شکست می‌دهد، و «با امتیاز 90.0 درصد، Gemini Ultra اولین مدلی است که از متخصصان انسانی در MMLU عملکرد بهتری دارد».

که هنوز برای استفاده گسترده در این مرحله در دسترس نیست، تواناترین مدل این مجموعه است. مانند Pro، برای چندوجهی بودن بومی آموزش دیده است و از قبل آموزش داده شده و بر روی پایه های کد مختلف تنظیم شده است.

Gemini Ultra می تواند اطلاعات ظریف متنی، کد و صدا را درک کند و به سوالات مرتبط با موضوعات پیچیده پاسخ دهد. Ultra در حدود 30 معیار از 32 معیار پرکاربرد مورد استفاده برای توسعه LLM از نتایج پیشرفته فعلی فراتر رفته است.

گوگل جمینی چقدر قدرتمند است؟

از زمانی که گوگل برای اولین بار ورود قریب الوقوع جمینی را اعلام کرد، تحلیلگران تلاش کردند تا پیش بینی کنند که چقدر می تواند قدرتمند باشد. ما در نهایت برخی از داده های واقعی به اشتراک گذاشته شده توسط Google در آخرین “گزارش فنی Gemini” داریم.

تیم هوش مصنوعی گفت که آنها در چند ماه گذشته مدل های Gemini خود را به دقت آزمایش کرده اند و عملکرد آنها را در کارهای مختلف ارزیابی می کنند. اگرچه بینش در مورد عملکرد Gemini Nano و Gemini Pro محدود است، داده‌های زیادی برای پیشنهاد رقبای Ultra bulldoze LLM وجود دارد.

با امتیاز حدود 90 درصد، Gemini Ultra اولین راه حلی است که قادر است در تست های Massive Multitask Language Understanding (MMLU) از متخصصان انسانی پیشی بگیرد. این آزمون ها از ترکیب 57 موضوع مختلف مانند فیزیک، ریاضی، تاریخ و اخلاق برای بررسی دانش دنیای واقعی و قابلیت های حل مسئله استفاده می کنند.

به گفته این تیم، رویکرد معیار جدید گوگل به MMLU به این معنی است که Gemini می تواند از توانایی های استدلال خود برای “دقت بیشتر” قبل از پاسخ دادن به سوالات استفاده کند.

Gemini Ultra همچنین امتیاز پیشرفته 59.4٪ را در معیار جدید MMMU به دست آورد. این معیار به عملکرد LLM ها در کارهای چندوجهی که نیاز به استدلال عمدی دارند می پردازد.

گوگل می‌گوید Gemini Ultra بدون کمک تشخیص کاراکتر شی از دیگر مدل‌های پیشرو بهتر عمل کرد و قابلیت‌های چندوجهی بومی راه‌حل را برجسته کرد.

این لزوماً به این معنی نیست که Google Gemini از مشکلات مشابهی که سایر مدل‌های زبان با آن مواجه هستند، مانند توهم هوش مصنوعی رنج نمی‌برد. حتی بهترین مدل‌های هوش مصنوعی مولد نیز می‌توانند در صورت درخواست به روش‌های خاص، به‌طور مشکل‌ساز پاسخ دهند.

آیا Gemini بهتر از GPT است؟

با افزایش تقاضا برای راه حل های هوش مصنوعی و مدل های LLM، گوگل رقابت زیادی در بازار فعلی دارد. هزاران مدل جدید و جدید می توانند عملکرد بهتری از Gemini داشته باشند، به خصوص اگر به تکامل خود ادامه دهند، مانند Falcon 180B.

با این حال، بسیاری از علاقه مندان به فناوری تنها به یک سوال پاسخ می دهند: “آیا بهتر از GPT-4 است؟” GPT-4، مدل زبان بزرگ چندوجهی OpenAI، تقریباً معیاری است که همه توسعه دهندگان برای ارزیابی پتانسیل LLM های جدید از آن استفاده می کنند.

به گفته گوگل، GPT-4 تنها در یک زمینه به نام «استدلال HellaSwag» بهتر از Gemini عمل می‌کند. این همان استدلال عامیانه ای است که برای کارهای روزمره استفاده می شود. GPT-4 در این زمینه امتیاز 95.3 درصد را به دست آورد، در حالی که جمینی 87.8 درصد است.

اشتراک گذاری