بهترین هوش مصنوعی برای تبدیل متن به تصویر

شنبه ۲۴ تیر ۱۴۰۲

بهترین هوش مصنوعی برای تبدیل متن به تصویر

طی دو سال اخیر مدل‌های هوش مصنوعی تولید تصویر رواج بالایی پیدا کرده‌اند و موانع فنی استفاده از آن‌ها تقریباً برطرف شده است.

مدل هوش مصنوعی جدید CM3Leon متا مدعی است که در مقایسه با نمونه‌های رقیب ازجمله مدل DALL-E 2، بهترین عملکرد را دارد. طی دو سال اخیر مدل‌های هوش مصنوعی تولید تصویر رواج بالایی پیدا کرده‌اند و موانع فنی استفاده از آن‌ها تقریباً برطرف شده است. البته این بدان معنا نیست که عملکرد این مدل‌ها پایدار شده و به سطح مناسبی رسیده است؛ ولی متا ادعا می‌کند که با مدل جدید CM3Leon دستاورد مهمی داشته و بهترین نمونه را در این حوزه ساخته است.

متا از مدل هوش مصنوعی جدیدی به نام CM3Leon (یا همان Chameleon یا «آفتاب‌پرست») رونمایی کرده و می‌گوید این سیستم می‌تواند در تبدیل متن به تصویر بهترین عملکرد را به نمایش بگذارد. این مدل همچنین یکی از اولین مدل‌هایی است که می‌تواند برای تصاویر توضیح یا کپشن بنویسد.

CM3Leon یک مدل مبدل یا «ترنسفورمر» است که با استفاده از مکانیزمی موسوم به «توجه» (Attention) سعی می‌کند ارتباط داده‌های موجود ازجمله متن یا تصاویر به یکدیگر را ارزیابی کند. این توجه در کنار دیگر ویژگی‌های مربوط به معماری در مدل‌های ترنسفورمر می‌تواند سرعت آموزش مدل‌ها را افزایش دهد. ساخت مدل‌های ترنسفورمر بزرگ‌تر با افزایش توان پردازشی ممکن می‌شود.

 

توان برای CM3Leon متا پنج‌برابر کمتر از مدل‌های مشابه است

متا ادعا می‌کند که CM3Leon از اکثر مدل‌های ترنسفورمر بهینه‌تر است، چون به پنج‌برابر توان پردازشی کمتر نیاز دارد و می‌تواند با پایگاه کوچک‌تری از داده‌ها آموزش داده شود. این شرکت برای آموزش مدل خود از میلیون‌ها تصویر از شرکت Shutterstock استفاده کرده است.

قوی‌ترین نسخه از CM3Leon حدود 7 میلیارد پارامتر دارد که تقریباً دو‌برابر مدل DALL-E 2 از شرکت OpenAI است. یکی از قابلیت‌های کلیدی مدل هوش مصنوعی جدید متا که به افزایش قدرت آن کمک کرده، تکنیکی موسوم به «بهینه‌سازی نظارتی» (SFT) است. این تکنیک قبلاً در مدل‌های متنی مثل ChatGPT استفاده شده بود و حالا در مدل‌های تصویری هم خود را ثابت کرده است.

مدل CM3Leon متا می‌تواند فرمان‌های مربوط به ویرایش تصاویر موجود را نیز درک کند. علاوه‌براین، همان‌طور که گفتیم، این مدل قادر است برای تصاویر توضیح کوتاه یا بلند بنویسد. عملکرد CM3Leon در این زمینه حتی از مدل‌های مخصوص خلق کپشن برای تصاویر مثل Flamingo و OpenFlamingo هم بهتر است.

متا هنوز اعلام نکرده که قصد عرضه مدل هوش مصنوعی CM3Leon را دارد یا نه و اگر پاسخ این سؤال مثبت است، این اتفاق چه زمانی خواهد افتاد.



تگ‌ها: هوش مصنوعی تبدیل متن به تصویر
آخرین مطالب
تفاوت گارانتی و خدمات پس از فروش در طراحی سایت
تفاوت گارانتی و خدمات پس از فروش در طراحی سایت

گارانتی و خدمات پس از فروش هر دو برای مشتریان امتیازی خاص محسوب می‌شوند اما از جنبه های مختلفی با یکدیگر متفاوت هستند که فواید آن ها را متمایز می سازند.

10 چالش راه اندازی کسب و کار اینترنتی
10 چالش راه اندازی کسب و کار اینترنتی

هرچند راه اندازی کسب و کار اینترنتی جذاب به نظر می‌رسد اما مشکلاتی مانند: رقابت شدید، چالش های فنی و تأمین مالی، ممکن است مسیر کارآفرینان را دشوارتر از حد انتظار کند.

مراحل ده گانه راه‌اندازی کسب‌وکار اینترنتی
مراحل ده گانه راه‌اندازی کسب‌وکار اینترنتی

راه اندازی کسب و کار اینترنتی موفق، مستلزم برنامه‌ریزی منسجم و اجرای صحیح آن است. با تحلیل مستمر فرآیندها، می‌توان به رشد پایدار در بازار رقابتی دیجیتال دست یافت.

بهترین زبان برنامه نویسی برای وب
بهترین زبان برنامه نویسی برای وب

برای کدنویسی وب سایتی ایده‌آل، باید با توجه به نوع آن از زبان‌های برنامه نویسی مناسب برای دو بخش بک اند (کدنویسی سمت سرور) و فرانت اند (ظاهر سایت) استفاده کرد.

راهنمای جامع طراحی صفحه وب ساده
راهنمای جامع طراحی صفحه وب ساده

طراحی صفحه وب ساده، نیازمند طی کردن مراحل دقیق و توجه به جزئیات است و از تعیین هدف تا پیاده‌ سازی و بهینه سازی، هر مرحله نقش مهمی در موفقیت نهایی وب‌سایت دارد.

تکنیک های بهینه سازی سرعت وب سایت
تکنیک های بهینه سازی سرعت وب سایت

بهینه سازی سرعت وب سایت با استفاده از تکنیک های خاصی مانند: فشرده سازی حجم تصاویر و بهینه سازی کدها به منظور جذب کاربران بیشتر صورت می‌گیرد.

قالب آماده پست و استوری آموزشـی برای اینستاگرام
قالب آماده پست و استوری آموزشـی برای اینستاگرام

طراحی پست و استوری‌های حرفه‌ای، کلید موفقیت در این شبکه اجتماعی است. با استفاده از قالب‌های آماده اینستاگرام، می‌توانید بدون داشتن دانش طراحی، پست‌ها و استوری‌هایی با کیفیت بالا ایجاد کنید.

راهنمای جامع تدوین نقشه راه کسب‌وکار اینترنتی
راهنمای جامع تدوین نقشه راه کسب‌وکار اینترنتی

نقشه راه کسب و کار اینترنتی، ابزاری استراتژیک است که با تحلیل دقیق بازار، تعیین اهداف و تدوین استراتژی های مؤثر، کسب و کارها را در مسیر رشد و موفقیت هدایت می‌کند.

مشخصات و قیمت احتمالی پیکسل بادز پرو 2
مشخصات و قیمت احتمالی پیکسل بادز پرو 2

گوگل قصد دارد نسل دوم پیکسل بادز پرو را با طراحی بهبودیافته، رنگ‌های جدید و تراشه قدرتمند سری Tensor A رونمایی کند.

راهنمای گام به گام ساخت اینفوگرافیک
راهنمای گام به گام ساخت اینفوگرافیک

با گذشت زمان، اهمیت انتقال سریع اطلاعات به مخاطبان سایت ها روز‌به‌روز بیشتر می‌شود که این موضوع با کمک ایجاد طرح های اینفوگرافیک در نرم‌افزارهای طراحی، قابل‌حل خواهد بود.

نحوه ساخت پادکست معرفی محصولات سایت
نحوه ساخت پادکست معرفی محصولات سایت

ساخت پادکست از روش های مؤثر برای ارتباط با مخاطبان و معرفی محصولات سایت است. پادکست مستقیماً وارد ذهن مخاطب می شود و او را با محصولات و خدمات سایت آشنا می کند.

مانیتور جدید ردمی با کیفیت 4K و قیمت کمتر از 170 دلار
مانیتور جدید ردمی با کیفیت 4K و قیمت کمتر از 170 دلار

شیائومی بی سروصدا مانیتور جدیدی را از برند ردمی معرفی کرد. این دستگاه که A27U نام دارد، مانیتوری 27 اینچی و مقرون ‌به‌ صرفه است.

آیفون 15 پرفروش‌ترین گوشی سه‌ماهه دوم سال 2024
آیفون 15 پرفروش‌ترین گوشی سه‌ماهه دوم سال 2024

اپل دوباره صدرنشین فهرست پرفروش‌ترین گوشی‌های جهان شد و سه مدل از آیفون 15 جایگاه‌های اول تا سوم را تسخیر کردند.



استعلام قیمت