ساخت تصویر با کمک هوش مصنوعی میدجرنی
میدجرنی(Midjourney) از معروفترین مدلهای هوش مصنوعی تولید تصویر است که به خاطر کیفیت بالای خود در تولید تصاویر هوش مصنوعی با اقبال بسیار خوبی از سمت کاربران مواجه شده است. این مدل با گرفتن یک متن به عنوان توصیفی از یک تصویر، آن را تولید میکند. به متنهایی که به سمت مدلهای هوش مصنوعی ارسال میشوند پرامپت(Prompt) میگویند. هر چقدر پرامپتهایی که نوشته میشوند از قوائد و استانداردها پیروی کنند، تصاویری که میدجرنی تولید میکند به خواستهها نزدیکتر هستند. حساسیت این موضوع باعث شده که حوزهای به نام مهندسی پرامپت به وجود بیاید که در آن به آموزش این قوائد و نحوهی استفادهی درست از آنها میپردازند.
در این مطلب و مطالب بعدی قصد داریم که شما را با مهندسی پرامپت برای مدلهای تصویری آشنا کنیم. پس همراه ما باشید.
ساختار پرامپهای تصویری
یک پرامپت در واقع یک متن است که شامل توضیح کاری است که از مدل انتظار داریم. مثلا توصیف یک تصویر یا توضیح یک کار. پرامپتهای تولید تصویر در میدجرنی به ترتیب از سه بخش تشکیل میشوند: آدرس عکسها + متن پرامپت + پارامترهای میدجرنی
- آدرس عکسها: در این بخش آدرس اینترنتی(URL) تصاویری که میخواهیم مدل از آنها برای تولید تصویر استفاده کند رو قرار میدهیم. میتوانیم هر چند عکس که نیاز است را در این بخش قرار دهیم و آنها را با فاصله(اسپیس ) از هم جدا کنیم.
- متن پرامپت: متنی که شامل توصیف تصویر خروجی مدل است.
- پارامترهای میدجرنی: همراه با پرامپت میتوان پارامترهایی را برای تنظیم خروجی مدل ارسال کرد.
در ادامهی این مطلب و همچنین مطالب بعدی به توضیح هر بخش و قوائد مهندسی پرامپت میپردازیم.
یک پرامپت خوب برای ساخت تصویر
تمرکز این بخش بر روی قسمت دوم پرامپت، یعنی متن پرامپت، است، با ما همراه باشید:
- زمانی که قصد تبدیل یک متن به تصویر را دارید باید به توصیف آنچه که در ذهن دارید بپردازید و از به کار برد کلمات اضافه پرهیز کنید.
- جزئیات را کامل و به اندازه توصیف کنید.
- رنگها را دقیقا نام ببرید، مثال «یک ماشین قرمز که بر روی آن یک گربهی سیاه نشسته است».
- میتوانید از تمها نام ببرید. مثلا یک تصویر را در فضای دیزنی یا انیمهای بکشید. مثال «یک خانم جوان با موهای آبی با تم انیمهای بکش».
- از اصطلاحات تخصصی عکاسی و یا نقاشی هم میتوانید استفاده کنید.
- موقعیت اجزای تصویر را کامل توصیف کنید. مثال «یک خانم جوان با مانتوی آبی که پشت آن یک ساختمان شیشهای است. در دست راست او یک گوشی موبایل است که تا مقابل صورتش آن را بالا آورده.»
- با زبان انگلیسی بنویسید. البته شما در متیس میتوانید به راحتی به زبان فارسی با مدل صحبت کنید.
پارامترهای پرامپت میدجرنی
گفتیم که پارامترها تنظیمات فنیای هستند که برای کنترل بیشتر روی خروجی مدلها میتوانیم آنها را همراه با پرامپت ارسال کنیم. پارامترها باید در انتهای پرامپت بیایند و با -- شروع میشوند. با کمک این پارامترها شما میتوانید تصویری نزدیکتر به آنچه که در ذهن دارید تولید کنید. به معرفی این تنظیمات بپردازیم.
تعیین نسبت تصویر در میدجرنی
نسبت تصویر عبارت است از نسبت عرض به طول تصویر. این ویژگی با نام Aspect Ratio نیز شناخته میشود و به شکل دو عدد که با «:» از یک دیگر جدا شدهاند نشان داده میشود. به این مثالها توجه کنید:
۱:۱
۶:۴
۷:۲
برای مشخص کردن ابعاد تصویر میتوان از پارامتر aspect-- یا ar-- استفاده کرد. به مثال زیر توجه کنید:
یک ماشین قرمز که بر روی آن یک گربهی سیاه نشسته. aspect-- 5:4
برخی از نسبت تصویرهای پر استفاده:
1:1 مقدار پیشفرض برای ابعاد.
5:4 ابعاد مناسب برای تصویری که بخواهیم آن را پرینت بگیریم.
3:2 ابعاد مناسب برای تصاویر عکاسی.
7:2 ابعاد نزدیک به تلویزیونهای HD و موبایلهای هوشمند.
تصویر زیر برخی از نسبت تصاویر را نشان میدهد.
حتما وبلاگ ما را دنبال کنید تا با سایر پارامترها آشنا شوید و بتوانید خروجیهای با کیفیت و مناسبی را از مدلهای تبدیل متن به تصویر بگیرید.