ساخت عکس با هوش مصنوعی- مهندسی پرامپت میدجرنی-بخش اول

ساخت تصویر با کمک هوش مصنوعی میدجرنی

میدجرنی(Midjourney) از معروف‌ترین مدل‌های هوش مصنوعی تولید تصویر است که به خاطر کیفیت بالای خود در تولید تصاویر هوش مصنوعی با اقبال بسیار خوبی از سمت کاربران مواجه شده است. این مدل با گرفتن یک متن به عنوان توصیفی از یک تصویر، آن را تولید می‌کند. به متن‌هایی که به سمت مدل‌های هوش مصنوعی ارسال می‌شوند پرامپت(Prompt) می‌گویند. هر چقدر پرامپت‌هایی که نوشته می‌شوند از قوائد و استانداردها پیروی کنند، تصاویری که میدجرنی تولید می‌کند به خواسته‌ها نزدیک‌تر هستند. حساسیت این موضوع باعث شده که حوزه‌ای به نام مهندسی پرامپت به وجود بیاید که در آن به آموزش این قوائد و نحوه‌ی استفاده‌ی درست از آنها می‌پردازند. 

در این مطلب و مطالب بعدی قصد داریم که شما را با مهندسی پرامپت‌ برای مدل‌های تصویری آشنا کنیم. پس همراه ما باشید.

 

ساختار پرامپ‌های تصویری

یک پرامپت در واقع یک متن است که شامل توضیح کاری است که از مدل انتظار داریم. مثلا توصیف یک تصویر یا توضیح یک کار. پرامپت‌های تولید تصویر در میدجرنی به ترتیب از سه بخش تشکیل می‌شوند:  آدرس عکس‌ها +‌ متن پرامپت + پارامترهای میدجرنی

 

ساختار پرامپت در میدجرنی
ساختار پرامپت در میدجرنی

 

  1. آدرس عکس‌ها: در این بخش آدرس اینترنتی(URL) تصاویری که می‌خواهیم مدل از آنها برای تولید تصویر استفاده کند رو قرار می‌دهیم. می‌توانیم هر چند عکس که نیاز است را در این بخش قرار دهیم و آنها را با فاصله(اسپیس ) از هم جدا کنیم.
  2. متن پرامپت: متنی که شامل توصیف تصویر خروجی مدل است.
  3. پارامترهای میدجرنی: همراه با پرامپت می‌توان پارامترهایی را برای تنظیم خروجی مدل ارسال کرد.

در ادامه‌ی این مطلب و همچنین مطالب بعدی به توضیح هر بخش و قوائد مهندسی پرامپت می‌پردازیم.

یک پرامپت خوب برای ساخت تصویر

تمرکز این بخش بر روی قسمت دوم پرامپت، یعنی متن پرامپت، است، با ما همراه باشید:

  • زمانی که قصد تبدیل یک متن به تصویر را دارید باید به توصیف آنچه که در ذهن دارید بپردازید و از به کار برد کلمات اضافه پرهیز کنید.
  • جزئیات را کامل و به اندازه توصیف کنید. 
  • رنگ‌ها را دقیقا نام ببرید، مثال «یک ماشین قرمز که بر روی آن یک گربه‌ی سیاه نشسته است».
  • می‌توانید از تم‌ها نام ببرید. مثلا یک تصویر را در فضای دیزنی یا انیمه‌ای بکشید. مثال «یک خانم جوان با موهای آبی با تم انیمه‌ای بکش».
  • از اصطلاحات تخصصی عکاسی و یا نقاشی هم می‌توانید استفاده کنید.
  • موقعیت اجزای تصویر را کامل توصیف کنید. مثال «یک خانم جوان با مانتوی آبی که پشت آن یک ساختمان شیشه‌ای است. در دست راست او یک گوشی موبایل است که تا مقابل صورتش آن را بالا آورده.»
  • با زبان انگلیسی بنویسید. البته شما در متیس می‌توانید به راحتی به زبان فارسی با مدل صحبت کنید.

 

پارامترهای پرامپت میدجرنی

گفتیم که پارامترها تنظیمات فنی‌ای هستند که برای کنترل بیشتر روی خروجی مدل‌ها می‌توانیم آنها را همراه با پرامپت ارسال کنیم. پارامترها باید در انتهای پرامپت بیایند و با -- شروع می‌شوند. با کمک این پارامترها شما می‌توانید تصویری نزدیک‌تر به آنچه که در ذهن دارید تولید کنید. به معرفی این تنظیمات بپردازیم.

تعیین نسبت تصویر در میدجرنی

نسبت تصویر عبارت است از نسبت عرض به طول تصویر. این ویژگی با نام Aspect Ratio نیز شناخته می‌شود و به شکل دو عدد که با «:» از یک دیگر جدا شده‌اند نشان داده می‌شود. به این مثال‌ها توجه کنید:

۱:۱

۶:۴

۷:۲

برای مشخص کردن ابعاد تصویر می‌توان از پارامتر aspect-- یا ar-- استفاده کرد. به مثال‌ زیر توجه کنید:

یک ماشین قرمز که بر روی آن یک گربه‌ی سیاه نشسته. aspect-- 5:4

برخی از نسبت‌ تصویرهای پر استفاده:

1:1 مقدار پیشفرض برای ابعاد.
5:4 ابعاد مناسب برای تصویری که بخواهیم آن را پرینت بگیریم.
3:2 ابعاد مناسب برای تصاویر عکاسی.
7:2 ابعاد نزدیک به تلویزیون‌های HD و موبایل‌های هوشمند.

تصویر زیر برخی از نسبت تصاویر را نشان می‌دهد.

 

نسبت تصاویر

 

حتما وبلاگ ما را دنبال کنید تا با سایر پارامترها آشنا شوید و بتوانید خروجی‌های با کیفیت و مناسبی را از مدل‌های تبدیل متن به تصویر بگیرید.