مدتی پیس استارتاپ هوش مصنوعی ایلان ماسک یعنیxAI، نسخه جدید چت باتش یعنی Grok-1.5 را معرفی کرد. حالا در ادامه رقابت این شرکت با OpenAI، مدل چندوجهی Grok-1.5 Vision یا Grok-1.5V رونمایی شده است. این هوش مصنوعی اکنون علاوه بر آنکه میتواند متن را درک کند، قادر به پردازش نمودار، اسکرینشات و تصاویر گوناگون میباشد.
این هوش مصنوعی در ورژن جدیدش میتواند با مدلهای چندوجهی پیشرفته دیگر در بخشهایی مثل: استدلال چندرشتهای، درک نمودارهای علمی، چارتها و تصاویر رقابت کند. گروک بهزودی برای افراد منتخب و برخی از کاربران فعلی این چتبات در دسترس خواهد بود.
پردازش داده های تصویری و چندوجهی توسط هوش مصنوعی گروگ
خواندن متن در تصویر، فهم مسائل ریاضی، تبدیل فلوچارت به کد پایتون، تولید داستانسرایی از نقاشی و تبدیل جدول به فرمت فایل CSV از قابلیتهای جدید نسخه ویژن Grok است. xAI در مقایسه این هوش مصنوعی با سایر شرکتهای پیشتاز در این زمینه مدعی است که Grok-1.5V در بنچمارک RealWorldQA از رقبایش بهتر عمل میکند. بنچمارک RealWorldQA با استفاده از 700 تصویر به همراه پرسش و پاسخ ایجاد شده است. در این تصاویر وسایل نقلیه گوناگون و اشیای دنیای واقعی وجود دارند. xAI این بنچمارک را با مجوز CC یا Creative Commons برای عموم منتشر کرده است.
مقایسه هوش منصوعی گروک با رقبایش
شرکت هوش مصنوعی ایلان ماسک از زمانی که چتبات آن برای اولینبار در سال 2023 رونمایی شد، پیشرفتهای زیادی داشته و دائماً در تلاش است تا با OpenAI و دیگر شرکتهای پیشتاز هوش مصنوعی رقابت کند اما این چتبات در این مدت چندان بیحاشیه نیز نبوده است. اخیراً محققان دریافتهاند که چتبات Grok میتواند درباره اقدامات مجرمانه به کاربران اطلاعات دهد! بااینحال xAI بهدنبال ساخت هوش جامع مصنوعی سودمند، با قابلیت درک جهان است. این هدف نشان میدهد که در ماههای آینده بهروزرسانیهای قابلتوجهی برای درک چندوجهی و قابلیتهای هوش مصنوعی مولد به Grok خواهد آمد.