یہ ایک ہے Stable Diffusion کے بارے میں جاننے کے لیے گائیڈ اور سکھائیں کہ آپ اس ٹول کو کیسے استعمال کر سکتے ہیں۔.
اوپر کی تصویر Stable Diffusion کے ساتھ بنائی گئی ہے۔ یہ مندرجہ ذیل متن سے تیار کیا گیا ہے (پرامپٹ)
اسکائی کریپرز کے ساتھ سٹی اسکائی لائن، بذریعہ Stanislav Sidorov، ڈیجیٹل آرٹ، انتہائی حقیقت پسندانہ، انتہائی تفصیلی، فوٹو ریئلسٹک، 4k، کردار کا تصور، نرم روشنی، بلیڈ رنر، مستقبل
اسٹیبل ڈفیوژن ایک ٹیکسٹ ٹو امیج مشین لرننگ ماڈل ہے۔ مصنوعی ذہانت کا ایک گہرا سیکھنے والا ماڈل جو ہمیں متن سے تصاویر بنانے کی اجازت دیتا ہے جسے ہم ان پٹ یا ان پٹ کے طور پر ڈالتے ہیں۔
یہ اس طرز کا پہلا ماڈل یا پہلا ٹول نہیں ہے، اس وقت Dall-e 2، MidJourney، Google Image کے بارے میں بہت سی باتیں ہو رہی ہیں، لیکن یہ سب سے اہم ہے کیونکہ یہ جس چیز کی نمائندگی کرتا ہے۔ Stable Diffusion ایک اوپن سورس پروجیکٹ ہے، لہذا کوئی بھی اسے استعمال اور ترمیم کرسکتا ہے۔ ورژن 1.4 میں ہمارے پاس ایک 4G .cpxt فائل ہے جہاں سے پورا پہلے سے تربیت یافتہ ماڈل آتا ہے، اور یہ ایک حقیقی انقلاب ہے۔
اتنا کہ اس کی ریلیز کے صرف 2 یا 3 ہفتوں میں، ہمیں فوٹو شاپ، جیمپ، کریٹا، ورڈپریس، بلینڈر، وغیرہ کے لیے پلگ ان ملتے ہیں۔ امیجز کے ساتھ آنے والا ہر ٹول اسٹیبل ڈفیوژن کو لاگو کر رہا ہے، یہاں تک کہ مڈجرنی جیسے حریف بھی اسے اپنے ٹولز کو بڑھانے کے لیے استعمال کر رہے ہیں۔ لیکن یہ نہ صرف ٹولز بنانے کے لیے استعمال ہوتا ہے بلکہ ہم بطور صارف اسے اپنے پی سی پر انسٹال کر کے اسے مقامی طور پر تصاویر حاصل کرنے کے لیے چلا سکتے ہیں۔
کیونکہ اوپن سورس ہونے کے علاوہ اس کا مطلب یہ نہیں ہے کہ یہ پچھلے سے کم طاقتور ہے۔ یہ ایک حقیقی عجوبہ ہے۔ میرے لیے ابھی یہ ایک بہترین ٹول ہے جسے ہم استعمال کر سکتے ہیں اگر ہم کسی بھی پروجیکٹ کے لیے اپنی تصاویر بنانا چاہتے ہیں۔
مستحکم بازی کو انسٹال کرنے اور استعمال کرنے کے طریقے
اسے استعمال کرنے کے مختلف طریقے ہیں۔ ابھی میں تجویز کرتا ہوں 2۔ اگر آپ کے کمپیوٹر میں ضروری طاقت ہے، یعنی تقریباً 8 جی بی ریم والا گرافکس کارڈ، تو اسے اپنے کمپیوٹر پر انسٹال کریں۔ اگر آپ کا ہارڈ ویئر کافی طاقتور نہیں ہے تو استعمال کریں a گوگل کولیب، ابھی میں Altryne کی سفارش کرتا ہوں، کیونکہ یہ گرافیکل انٹرفیس کے ساتھ آتا ہے اور استعمال کرنا آسان ہے۔
تفصیل سے قدم.
آلٹرین کا کولاب
یہ وہ آپشن ہے جس کی میں تجویز کرتا ہوں اگر آپ کا کمپیوٹر کافی طاقتور نہیں ہے (8 جی بی ریم والا GPU) یا اگر آپ اسے انسٹال کیے بغیر اس کی تمام خصوصیات کے ساتھ آزمانا چاہتے ہیں۔
میں اس کی سفارش کرتا ہوں کیونکہ اس میں تصاویر اور دیگر ماڈل ٹولز جیسے امیج ٹو امیج اور اپ سکیل کو کنٹرول کرنے کے بہت سے اختیارات کے ساتھ ایک بہت ہی آرام دہ گرافیکل انٹرفیس ہے۔
ہم استعمال کرتے ہیں Google colab کو Altryne نے بنایا اور ماڈل اور نتائج کو محفوظ کرنے کے لیے گوگل ڈرائیو۔
یہ سب مفت ہے. میں اس سارے عمل کی ایک ویڈیو چھوڑتا ہوں جو آپ دیکھیں گے کہ بہت آسان ہے۔
پی سی پر انسٹال کریں
اسے پی سی سے انسٹال کرنے کے لیے آپ اس کے گٹ ہب میں دی گئی ہدایات پر عمل کر سکتے ہیں، https://github.com/CompVis/stable-diffusion یا گرافیکل انٹرفیس کے ساتھ اس کے ورژن میں جو مجھے بہت زیادہ پسند ہے۔ https://github.com/AUTOMATIC1111/stable-diffusion-webui اور ونڈوز اور لینکس پر آپ اس ایگزیکیوٹیبل کو انسٹال کرنے کے لیے استعمال کر سکتے ہیں۔ مستحکم بازی UI v2
آپ پہلے ہی جانتے ہیں کہ آپ کو ایک طاقتور GPU کی ضرورت ہے جس میں کم از کم 8Gb RAM ہو تاکہ یہ آسانی سے کام کر سکے۔ آپ اسے CPU پل کر سکتے ہیں، لیکن یہ بہت سست ہے اور یہ آپ کے پروسیسر پر بھی منحصر ہوگا۔ لہذا اگر آپ کا سامان پرانا ہے تو آپ کو Stable Diffusion استعمال کرنے کے لیے Colab یا ادائیگی کا کوئی طریقہ استعمال کرنے کے لیے خود کو استعفیٰ دینا ہوگا۔
اسے اپنے پی سی پر رکھنے کے فوائد یہ ہیں کہ اس کا استعمال بہت تیز ہے، آپ کو کسی بھی چیز کو انسٹال یا کنفیگر کرنے کی ضرورت نہیں ہے، صرف ایک بار کر لینا ہی کافی ہے، اس کے بعد سے ہر چیز بہت تیز ہے۔
اس کے علاوہ، مجھے یہ بہت پسند کرنے کی ایک اور وجہ یہ ہے کہ میں اسے دیگر اسکرپٹس میں ضم کر سکتا ہوں اور تخلیق شدہ تصاویر کو براہ راست کاموں کے ورک فلو میں داخل کر کے فائدہ اٹھا سکتا ہوں، جو کہ ایک بہت اہم نکتہ ہے۔
آفیشل کولیب ڈفیوزر
یہ Colab سے بہت ملتا جلتا ہے جس کی میں نے اوپر تجویز کی ہے، یہ تقریباً ویسا ہی چلتا ہے، آپ کو ماڈل اپ لوڈ کرنے کی ضرورت نہیں ہے، لیکن اس میں گرافیکل انٹرفیس نہیں ہے اور کسی بھی آپشن میں ترمیم کرنے کے لیے آپ کو کوڈ کے آپشنز کو تبدیل کرنا ہوگا۔ بلاک کریں اور ان میں ترمیم کریں تاکہ ہمیں ضرورت کے مطابق ایڈجسٹ کیا جا سکے۔
اس کے علاوہ ہم امیج ٹو امیج آپشن کا استعمال نہیں کر سکتے جو کہ بہت پرکشش ہے۔
آپ اس سے رسائی حاصل کر سکتے ہیں۔ https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb
ہمارے پاس بالغوں کی تصاویر کے لیے ایک فلٹر ہے، مشہور NSFW، لیکن آپ اس کوڈ کا استعمال کرتے ہوئے اسے غیر فعال کر سکتے ہیں، یعنی دستاویز میں ایک سیل بنا کر
def dummy_checker(images, **kwargs): return images, False http://pipe.safety_checker = dummy_checker
آپ کو اسے سیل کے فوراً بعد لگانا ہوگا۔
pipe = pipe.to("cuda")
اور اسے چلائیں
Colab Stable Diffusion Infinity
اس Colab میں ہم انفینٹی ٹول استعمال کر سکتے ہیں، جو ہمیں تصاویر کو مکمل کرنے کی اجازت دیتا ہے۔ موجودہ تصویر سے مواد بنائیں۔ ایک حقیقی پاس۔
مستحکم بازی کے ساتھ خواب بوتھ
یہ مستحکم بازی کے ساتھ گوگل کے ڈریم بوتھ کا نفاذ ہے جو کسی شخص کی چند تصاویر سے، چہرے کے ساتھ ذاتی نوعیت کے نتائج حاصل کرنے کی اجازت دیتا ہے۔
تصاویر کو اپنی مرضی کے مطابق کرنے کا ایک حیرت انگیز طریقہ
https://github.com/XavierXiao/Dreambooth-Stable-Diffusion
دیگر کولابس
آپ پہلے ہی جانتے ہیں کہ Colab میں کیسے کام کرنا ہے، ٹھیک ہے میں آپ کو دوسروں کے لیے چھوڑ دوں گا جو میں ڈھونڈ رہا ہوں تاکہ آپ اپنی پسند کا استعمال کر سکیں۔ یہاں تک کہ اگر آپ چاہیں تو آپ ایک کاپی بنا سکتے ہیں اور اپنی پسند کے مطابق اس میں ترمیم کر سکتے ہیں تاکہ آپ کا اپنا ورژن ہو۔
- https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
- https://colab.research.google.com/drive/1Iy-xW9t1-OQWhb0hNxueGij8phCyluOh#scrollTo=B977dVS6AZcL
- نقصان دہ امیج کمپریشن کے لیے مستحکم بازی https://colab.research.google.com/drive/1Ci1VYHuFJK5eOX9TB0Mq4NsqkeDrMaaH?usp=sharing
- کیرا کے ساتھ عمل درآمد https://colab.research.google.com/drive/1zVTa4mLeM_w44WaFwl7utTaa6JcaH1zK
اس کی سرکاری ویب سائٹ سے
اسے استعمال کرنے کا ایک آسان طریقہ، جیسے کہ آپ OpenAI میں Dall-e 2 استعمال کرتے ہیں، لیکن اگر آپ پلیٹ فارم استعمال کرتے ہیں تو سروس کی ادائیگی ہوتی ہے۔ https://stability.ai/
HuggingFace سے
اسے جلدی سے جانچنے اور کچھ تصاویر لینے کا ایک دلچسپ آپشن، صرف یہ دیکھنے کے لیے کہ یہ کیسے کام کرتا ہے، لیکن بہت سے آپشنز ہیں جو ہم استعمال کریں گے اگر ہم اس بارے میں سنجیدہ ہونے جا رہے ہیں۔
https://huggingface.co/spaces/stabilityai/stable-diffusion
AWS یا کچھ کلاؤڈ سروس استعمال کرنا
اسٹیبل ڈفیوژن ماڈل کو کلاؤڈ میں ہارڈ ویئر پر چلا کر استعمال کیا جا سکتا ہے، ایک کلاسک سروس Amazon کی AWS ہے۔ ابھی میں مختلف الگورتھم کے ساتھ کام کرنے کے لیے EC2 مثالوں کے ساتھ جانچ کر رہا ہوں۔ میں آپ کو بتاتا ہوں کہ یہ کیسا ہے۔
دیگر ادائیگی کی خدمات
اسٹاک فوٹوز میں نفاذ سے لے کر ویب سائٹس تک بہت سے اور بہت کچھ ابھر رہے ہیں جو ہمیں APIs کے ساتھ ضم کرنے کی اجازت دیتے ہیں۔ اس وقت اس نے میری توجہ مبذول کرلی ہے، حالانکہ ذاتی طور پر میں مفت خدمات استعمال کرنے جا رہا ہوں۔
فوری انجینئرنگ کے اوزار
انجینئرنگ پرامپٹ وہ حصہ ہے جو پرامپٹ کی جنریشن سے مراد ہے، یعنی وہ جملہ جس کے ساتھ ہم ماڈل کو فیڈ کرتے ہیں تاکہ یہ ہماری امیجز تیار کرے۔ یہ کوئی معمولی مسئلہ نہیں ہے اور آپ کو اچھی طرح جاننا ہوگا کہ بہترین نتائج حاصل کرنے کے لیے اسے کس طرح استعمال کرنا ہے۔
سیکھنے کا ایک بہت ہی مفید ٹول ہے۔ لغت، جہاں ہم تصاویر اور ان کا استعمال کیا ہوا اشارہ دیکھتے ہیں، بیج اور رہنمائی کا پیمانہ۔
اپنے ارد گرد براؤز کرنے سے یہ معلوم ہو جائے گا کہ آپ جس قسم کے نتائج کی تلاش کر رہے ہیں اسے حاصل کرنے کے لیے آپ کو پرامپٹ پر کس قسم کے عناصر کو تفویض کرنا ہے۔