ساخت تصویر با کمک هوش مصنوعی میدجرنی
میدجرنی(Midjourney) از معروفترین مدلهای هوش مصنوعی تولید تصویر است که به خاطر کیفیت بالای خود در تولید تصاویر هوش مصنوعی با اقبال بسیار خوبی از سمت کاربران مواجه شده است. این مدل با گرفتن یک متن به عنوان توصیفی از یک تصویر، آن را تولید میکند. به متنهایی که به سمت مدلهای هوش مصنوعی ارسال میشوند پرامپت(Prompt) میگویند. هر چقدر پرامپتهایی که نوشته میشوند از قوائد و استانداردها پیروی کنند، تصاویری که میدجرنی تولید میکند به خواستهها نزدیکتر هستند. حساسیت این موضوع باعث شده که حوزهای به نام مهندسی پرامپت به وجود بیاید که در آن به آموزش این قوائد و نحوهی استفادهی درست از آنها میپردازند.
ما در مطلب قبلی نیز به نکات دیگری اشاره کردیم، پیشنهاد میکنیم حتما آنها را نیز دنبال کنید. همچنین در مطالب بعدی هم همراه ما باشید.
تغییر عکس با کمک هوش مصنوعی
اگر قصد ایجاد تغییر در یک عکس را با کمک هوش مصنوعی دارید میتوانید در بخش اول پرامپت آن را به مدل ارسال کنید. عکس حتما باید به صورت آپلود شده باشد و URL پابلیک آن برای مدل ارسال شود. به مثال زیر توجه کنید:
https://imageURL1.png https://imageURL2.png an orange cat slept on a red car —-aspect 4:9 --no plants
در پرامپت بالا دو تصویر برای مدل ارسال شده است و در بخش دوم نیز متن پرامپت آورده شده. بخش سوم هم دو پارامت ابعاد، که در بلاگ قبلی در مورد آن صحبت کردیم، و یک پرامپت منفی را شامل میشود. برای تست کردن این قابلیت میتوانید از ربات میدجرنی در آتنا استفاده کنید.
تعیین کاراکتر اصلی برای تصاویر هوش مصنوعی
یکی از مفیدترین کارهایی که با مدلهای تولید تصویر میتوان انجام داد تولید انواع مختلف از یک تصویر پایه یا کاراکتر اصلی است. تصور کنید که شما یک تصویر دارید و حالا نیاز است انواع مختلفی از آن را با طرحهای مختلف یا حالات مختلف تولید کنید. یا به عنوان یک طراح کارتون، بازی یا انیمیشن یک کاراکتر خلق کردهاید و میخواهید کاراکتر را در پوزیشنها و لوکیشنهای مختلف داشته باشید(مثل تصاویری که در این پست میبینید). این کار با مدلهای تولید تصویر به راحتی قابل انجام است. به این قابلیت «Character Reference» میگویند. تصویر شمارهی یک، یک تصویر پایه است و سایر تصاویر بر روی آن ساخته شدهاند.
برای تنظیم کردن کاراکتر اصلی میتوان از پارامتر --cref استفاده کرد. اگر ما تصویر بالا را به عنوان کاراکتر اصلی و با پرامتر زیر به مدل ارسال کنیم، تصاویر زیر را به عنوان خروجی میگیریم:
illustration of a man sitting in a cafe --cref https://url.com/BlueHairGuy.png
زمانی که یک تصویر پایه را در نظر میگیرید شما میتوانید به آن وزن نیز بدهید. به این معنی که تا چه حد به جزئیات تصویر شما در تولید تصویر توجه شود. شما این وزن را با پارامتر cw-— اعمال کنید. بازهی این پارامتر بین ۰ تا ۱۰۰ است. ۰ به معنای صرفا در نظر گرفتن چهره است و ۱۰۰ به معنی در نظر گرفتن حالت موها، استایل صورت، رنگ و... است. مقدار پیشفرض این پارامتر ۱۰۰ است. به نمونه پرامپت زیر توجه کنید:
illustration of a man sitting in a cafe --cref https://url.com/BlueHairGuy.png --cw 0
توجه داشته باشید که تصاویری که به عنوان کاراکتر اصلی به مدل میدهید باید کاراکترهای طراحی شده باشند نه تصاویر صورت واقعی انسان که عکاسی شدهاند.
تولید تصاویر بسیار متنوع با هوش مصنوعی
یکی از جالبترین کارهایی که با مدلهای تولید تصویر میتوان انجام داد، ایجاد تنوع و خلاقیت در تصاویر است. همانطور که میدانید مدل میدجرنی به ازای یک پرامپت چهار تصویر تولید میکند. پارامتر chaos به شما این امکان را میدهد که میزان تصادفی بودن و خلاقیت در تولید این چهار تصویر را کنترل کنید. این پارامتر به ویژه برای زمانی که میخواهید تصاویر غیرمنتظره و خلاقانه تولید کنید، مفید است.
برای استفاده از این پارامتر کافی است تا از پارامتر chaos-- استفاده کنید و مقدار آن را تعیین کنید. به مثال زیر توجه کنید:
illustration of a futuristic city --chaos 50
زمانی که از پارامتر chaos استفاده میکنید، میتوانید میزان تصادفی بودن را از ۰ تا ۱۰۰ تنظیم کنید. ۰ به معنای کمترین میزان تصادفی بودن و ۱۰۰ به معنای بیشترین میزان تصادفی بودن است. مقدار پیشفرض این پارامتر ۰ است. به تصاویر زیر به ازای مقادیر مختلف این پارامتر توجه کنید:
.
در آموزشهای بعدی پارامترهای بیشتری را با یکدیگر مرور میکنیم.