ساخت عکس با هوش مصنوعی- مهندسی پرامپت میدجرنی-بخش دوم

ساخت تصویر با کمک هوش مصنوعی میدجرنی

میدجرنی(Midjourney) از معروف‌ترین مدل‌های هوش مصنوعی تولید تصویر است که به خاطر کیفیت بالای خود در تولید تصاویر هوش مصنوعی با اقبال بسیار خوبی از سمت کاربران مواجه شده است. این مدل با گرفتن یک متن به عنوان توصیفی از یک تصویر، آن را تولید می‌کند. به متن‌هایی که به سمت مدل‌های هوش مصنوعی ارسال می‌شوند پرامپت(Prompt) می‌گویند. هر چقدر پرامپت‌هایی که نوشته می‌شوند از قوائد و استانداردها پیروی کنند، تصاویری که میدجرنی تولید می‌کند به خواسته‌ها نزدیک‌تر هستند. حساسیت این موضوع باعث شده که حوزه‌ای به نام مهندسی پرامپت به وجود بیاید که در آن به آموزش این قوائد و نحوه‌ی استفاده‌ی درست از آنها می‌پردازند. 

ما در مطلب قبلی نیز به نکات دیگری اشاره کردیم، پیشنهاد می‌کنیم حتما آنها را نیز دنبال کنید. همچنین در مطالب بعدی هم همراه ما باشید.

 

تغییر عکس با کمک هوش مصنوعی

اگر قصد ایجاد تغییر در یک عکس را با کمک هوش مصنوعی دارید می‌توانید در بخش اول پرامپت آن را به مدل ارسال کنید. عکس حتما باید به صورت آپلود شده باشد و URL پابلیک آن برای مدل ارسال شود. به مثال زیر توجه کنید:

 

https://imageURL1.png https://imageURL2.png  an orange cat slept on a red car —-aspect 4:9 --no plants

 

در پرامپت بالا دو تصویر برای مدل ارسال شده است و در بخش دوم نیز متن پرامپت آورده شده. بخش سوم هم دو پارامت ابعاد، که در بلاگ قبلی در مورد آن صحبت کردیم، و یک پرامپت منفی را شامل می‌شود. برای تست کردن این قابلیت می‌توانید از ربات میدجرنی در آتنا استفاده کنید.

 

تعیین کاراکتر اصلی برای تصاویر هوش مصنوعی

یکی از مفید‌ترین کارهایی که با مدل‌های تولید تصویر می‌توان انجام داد تولید انواع مختلف از یک تصویر پایه یا کاراکتر اصلی است. تصور کنید که شما یک تصویر دارید و حالا نیاز است انواع مختلفی از آن را با طرح‌های مختلف یا حالات مختلف تولید کنید. یا به عنوان یک طراح کارتون، بازی یا انیمیشن یک کاراکتر خلق کرده‌اید و می‌خواهید کاراکتر را در پوزیشن‌ها و لوکیشن‌های مختلف داشته باشید(مثل تصاویری که در این پست می‌بینید). این کار با مدل‌های تولید تصویر به راحتی قابل انجام است. به این قابلیت «Character Reference» می‌گویند.  تصویر شماره‌ی یک، یک تصویر پایه است و سایر تصاویر بر روی آن ساخته شده‌اند.

 

تصویر پایه در تولید تصویر از متن در متیس
تصویر پایه

 

برای تنظیم کردن کاراکتر اصلی می‌توان از پارامتر --cref استفاده کرد. اگر ما تصویر بالا را به عنوان کاراکتر اصلی و با پرامتر زیر به مدل ارسال کنیم، تصاویر زیر را به عنوان خروجی می‌گیریم:

 

illustration of a man sitting in a cafe --cref https://url.com/BlueHairGuy.png

 

تصاویر تولید شده از تصویر پایه در هوش مصنوعی متیس و میدجرنی
تصاویر ساخته شده بر اساس تصویر پایه

 

زمانی که یک تصویر پایه را در نظر می‌گیرید شما می‌توانید به آن وزن نیز بدهید. به این معنی که تا چه حد به جزئیات تصویر شما در تولید تصویر توجه شود. شما این وزن را با پارامتر cw-— اعمال کنید. بازه‌ی این پارامتر بین ۰ تا ۱۰۰ است. ۰ به معنای صرفا در نظر گرفتن چهره است و ۱۰۰ به معنی در نظر گرفتن حالت موها، استایل صورت، رنگ و... است. مقدار پیشفرض این پارامتر ۱۰۰ است. به نمونه پرامپت زیر توجه کنید:

 

illustration of a man sitting in a cafe --cref https://url.com/BlueHairGuy.png --cw 0

 

توجه داشته باشید که تصاویری که به عنوان کاراکتر اصلی به مدل می‌دهید باید کاراکترهای طراحی شده باشند نه تصاویر صورت واقعی انسان که عکاسی شده‌اند.

 

تولید تصاویر بسیار متنوع با هوش مصنوعی

یکی از جالب‌ترین کارهایی که با مدل‌های تولید تصویر می‌توان انجام داد، ایجاد تنوع و خلاقیت در تصاویر است. همانطور که می‌دانید مدل میدجرنی به ازای یک پرامپت چهار تصویر تولید می‌کند. پارامتر chaos به شما این امکان را می‌دهد که میزان تصادفی بودن و خلاقیت در تولید این چهار تصویر را کنترل کنید. این پارامتر به ویژه برای زمانی که می‌خواهید تصاویر غیرمنتظره و خلاقانه تولید کنید، مفید است. 

برای استفاده از این پارامتر کافی است تا از پارامتر chaos-- استفاده کنید و مقدار آن را تعیین کنید. به مثال زیر توجه کنید:

 

illustration of a futuristic city --chaos 50

 

زمانی که از پارامتر chaos استفاده می‌کنید، می‌توانید میزان تصادفی بودن را از ۰ تا ۱۰۰ تنظیم کنید. ۰ به معنای کمترین میزان تصادفی بودن و ۱۰۰ به معنای بیشترین میزان تصادفی بودن است. مقدار پیشفرض این پارامتر ۰ است. به تصاویر زیر به ازای مقادیر مختلف این پارامتر توجه کنید:

 

 .                   

 

در آموزش‌های بعدی پارامتر‌های بیشتری را با یکدیگر مرور می‌کنیم.