Stable Diffusion ဆိုတာ ဘာလဲ၊ ဘယ်လို တပ်ဆင်အသုံးပြုရမလဲ

တည်ငြိမ်သောပျံ့နှံ့မှုနှင့်အတူထုတ်ပေးသောရုပ်ပုံများ

ဒါတစ်ခုပါ Stable Diffusion အကြောင်း လေ့လာရန် လမ်းညွှန်ပြီး ဤကိရိယာကို သင်မည်ကဲ့သို့ အသုံးပြုနိုင်ကြောင်း သင်ကြားပေးပါ။.

အထက်ဖော်ပြပါပုံကို Stable Diffusion ဖြင့် ထုတ်လုပ်ထားသည်။ ၎င်းကို အောက်ပါစာသား (prompt) မှ ထုတ်လုပ်ထားပါသည်။

Stanislav Sidorov မှ မိုးမျှော်တိုက်များ၊ ဒစ်ဂျစ်တယ်အနုပညာ၊ အလွန်လက်တွေ့ဆန်သော၊ အလွန်အသေးစိတ်၊ ဓာတ်ပုံဆန်သော၊ 4k၊ ဇာတ်ကောင်အယူအဆ၊ ပေါ့ပါးသောအလင်းရောင်၊ ဓါးပြေးသမား၊ အနာဂတ်ဆန်သော

Stable Diffusion သည် text-to-image machine learning model တစ်ခုဖြစ်သည်။ ထည့်သွင်းမှု သို့မဟုတ် ထည့်သွင်းမှုအဖြစ် ကျွန်ုပ်တို့ထည့်သွင်းထားသည့် စာသားများမှ ရုပ်ပုံများကို ထုတ်လုပ်နိုင်စေမည့် ဥာဏ်ရည်တု၏ နက်နဲသောသင်ယူမှုပုံစံ။

၎င်းသည် ပထမဆုံး မော်ဒယ် သို့မဟုတ် ဤစတိုင်၏ ပထမဆုံး တူးလ်မဟုတ်ပါ၊ ယခု Dall-e 2၊ MidJourney၊ Google Image အကြောင်း ပြောဆိုမှုများ အများအပြားရှိသော်လည်း ၎င်းသည် ၎င်းကို ကိုယ်စားပြုသောကြောင့် အရေးကြီးဆုံးဖြစ်သည်။ Stable Diffusion သည် Open Source ပရောဂျက်တစ်ခုဖြစ်သောကြောင့် မည်သူမဆို ၎င်းကို အသုံးပြု၍ ပြင်ဆင်နိုင်သည်။ ဗားရှင်း 1.4 တွင် ကျွန်ုပ်တို့တွင် 4G .cpxt ဖိုင်တစ်ခုရှိပြီး ကြိုတင်လေ့ကျင့်ထားသည့်မော်ဒယ်တစ်ခုလုံးမှ ထွက်ပေါ်လာပြီး ၎င်းသည် တကယ့်တော်လှန်ရေးတစ်ခုဖြစ်သည်။

ထွက်လာပြီး 2 ပတ် သို့မဟုတ် 3 ပတ်အတွင်းတွင်၊ PhotoShop၊ GIMP၊ Krita၊ WordPress၊ Blender စသည်ဖြင့် ပလပ်အင်များကို ရှာတွေ့နိုင်ပါသည်။ ရုပ်ပုံများပါရှိသည့် ကိရိယာတိုင်းသည် Stable Diffusion ကို အကောင်အထည်ဖော်နေသည်၊ ထို့ကြောင့် Midjourney ကဲ့သို့သော ပြိုင်ဘက်များပင် ၎င်းတို့၏ကိရိယာများကို မြှင့်တင်ရန် ၎င်းကို အသုံးပြုနေကြပါသည်။ သို့သော် ၎င်းကို ကိရိယာများထုတ်လုပ်ရန်သာမက အသုံးပြုသူများအနေဖြင့် ၎င်းကို ကျွန်ုပ်တို့၏ PC တွင် ထည့်သွင်းနိုင်ပြီး စက်တွင်းပုံများကို ရယူရန်အတွက် ၎င်းကို run နိုင်သည်။

ဘာကြောင့်လဲဆိုတော့ Open Source က အရင်ကထက် အစွမ်းထက်တယ်လို့ မဆိုလိုပါဘူး။ ဒါဟာ တကယ့် အံ့သြစရာပါပဲ။ ကျွန်ုပ်အတွက် ယခုအချိန်တွင် ၎င်းသည် ပရောဂျက်တစ်ခုအတွက် ကျွန်ုပ်တို့၏ပုံများကို ထုတ်လုပ်လိုပါက ကျွန်ုပ်တို့အသုံးပြုနိုင်သည့် အကောင်းဆုံးကိရိယာဖြစ်သည်။

Stable Diffusion ကို ထည့်သွင်းပြီး အသုံးပြုရန် နည်းလမ်းများ

အသုံးပြုနည်းအမျိုးမျိုးရှိပါတယ်။ ယခု ကျွန်ုပ်အကြံပြုလိုသည်မှာ 2. သင့်ကွန်ပြူတာတွင် လိုအပ်သော ပါဝါ၊ ဆိုလိုသည်မှာ RAM 8Gb ခန့်ရှိသော ဂရပ်ဖစ်ကတ်တစ်ခုရှိပါက သင့်ကွန်ပျူတာပေါ်တွင် ထည့်သွင်းပါ။ အကယ်၍ သင့် hardware သည် လုံလောက်စွာ မစွမ်းဆောင်ပါက a ကို အသုံးပြုပါ။ Google ပူးပေါင်းဆောင်ရွက်ခြင်းဂရပ်ဖစ်အင်တာဖေ့စ်ပါရှိ၍ အသုံးပြုရပိုမိုလွယ်ကူသောကြောင့် ယခု Altryne ကို ကျွန်ုပ်အကြံပြုပါသည်။

အသေးစိတ်လုပ်ဖို့အဆင့်.

Altryne ၏ Colab

သင့်ကွန်ပြူတာသည် လုံလောက်သော စွမ်းအားမရှိပါက (GPU 8Gb of RAM) သို့မဟုတ် မည်သည့်အရာမှ ထည့်သွင်းစရာမလိုဘဲ ၎င်း၏အင်္ဂါရပ်အားလုံးကို စမ်းကြည့်လိုပါက ဤရွေးချယ်မှုဖြစ်သည်။

ပုံများကို ထိန်းချုပ်ရန်နှင့် ရုပ်ပုံမှ ရုပ်ပုံအထိ နှင့် အဆင့်မြှင့်ခြင်းကဲ့သို့သော အခြားမော်ဒယ်လ်ကိရိယာများကို ထိန်းချုပ်ရန် ရွေးချယ်စရာများစွာပါရှိသော အလွန်အဆင်ပြေသော ဂရပ်ဖစ် အင်တာဖေ့စ်ပါရှိသောကြောင့် ကျွန်ုပ်အကြံပြုလိုပါသည်။

ငါတို့သုံးတယ် Altryne မှ ဖန်တီးထားသော Google colab မော်ဒယ်နှင့် ရလဒ်များကို သိမ်းဆည်းရန် နှင့် Google Drive။

အားလုံးအခမဲ့ဖြစ်သည်။. သင်တွေ့မြင်ရသည့်အတိုင်း အလွန်ရိုးရှင်းသော လုပ်ငန်းစဉ်တစ်ခုလုံး၏ ဗီဒီယိုဖိုင်ကို ကျွန်ုပ်ချန်ထားခဲ့သည်။

PC ပေါ်တွင် install လုပ်ပါ

၎င်းကို PC မှ ထည့်သွင်းရန် ၎င်း၏ GitHub တွင် ဖော်ပြထားသည့် ညွှန်ကြားချက်များကို လိုက်နာနိုင်သည်၊ https://github.com/CompVis/stable-diffusion ဒါမှမဟုတ် ကျွန်တော်အများကြီးပိုကြိုက်တဲ့ graphical interface ပါတဲ့ သူ့ရဲ့ဗားရှင်းမှာ https://github.com/AUTOMATIC1111/stable-diffusion-webui နှင့် windows နှင့် linux တွင် ၎င်းကို install လုပ်ရန် ဤ executable ကိုသုံးနိုင်သည်။ Stable Diffusion UI v2

၎င်းကို ချောမွေ့စွာ လုပ်ဆောင်နိုင်စေရန်အတွက် အနည်းဆုံး RAM 8Gb ရှိသော အစွမ်းထက် GPU လိုအပ်ကြောင်း သင်သိထားပြီးဖြစ်သည်။ ၎င်းအား CPU ဆွဲထုတ်နိုင်သော်လည်း ၎င်းသည် များစွာနှေးကွေးပြီး သင့်တွင်ရှိသော ပရိုဆက်ဆာပေါ်တွင်လည်း မူတည်မည်ဖြစ်သည်။ ထို့ကြောင့် သင့်စက်ပစ္စည်းသည် ဟောင်းနေပါက Stable Diffusion ကိုအသုံးပြုရန် Colab သို့မဟုတ် ငွေပေးချေမှုနည်းလမ်းအချို့ကို သင်ကိုယ်တိုင် နုတ်ထွက်ရမည်ဖြစ်ပါသည်။

၎င်းကို PC တွင်ထားရှိခြင်း၏ အားသာချက်မှာ အသုံးပြုရပိုမိုမြန်ဆန်သည်၊ မည်သည့်အရာကိုမျှ ထည့်သွင်းရန် သို့မဟုတ် configure လုပ်ရန် မလိုအပ်ဘဲ၊ ၎င်းကို တစ်ကြိမ်ပြုလုပ်ရုံဖြင့် လုံလောက်သည်၊ ထိုအချိန်မှစ၍ အရာအားလုံးသည် ပိုမိုမြန်ဆန်လာသည်။

ဒါ့ပြင်၊ ကျွန်တော်အရမ်းကြိုက်ရတဲ့ နောက်ထပ်အကြောင်းရင်းတစ်ခုကတော့ အဲဒါကို တခြား script တွေမှာ ပေါင်းစည်းနိုင်ပြီး အလုပ်တွေရဲ့ workflow ထဲကို တိုက်ရိုက်ထည့်သွင်းခြင်းအားဖြင့် ထုတ်လုပ်လိုက်တဲ့ ပုံတွေရဲ့ အားသာချက်ကို အသုံးချနိုင်လို့ပါပဲ၊ ဒါက အရမ်းအရေးကြီးတဲ့အချက်ပါပဲ။

တရားဝင် Collab Diffusers

အထက်တွင်ဖော်ပြခဲ့သော Colab နှင့် အလွန်ဆင်တူသည်၊ ၎င်းသည် အတူတူနီးပါးအလုပ်လုပ်သည်၊ သင်သည် မော်ဒယ်ကို အပ်လုဒ်လုပ်ရန် မလိုအပ်ပါ၊ သို့သော် ၎င်းတွင် graphical interface မရှိသည့်အပြင် မည်သည့်ရွေးချယ်မှုကိုမှ မွမ်းမံရန်အတွက် သင်သည် ကုဒ်၏ရွေးချယ်မှုများကို ပြောင်းလဲရန် လိုအပ်သည်။ ပိတ်ဆို့ပြီး ကျွန်ုပ်တို့ လိုအပ်သည်များကို ချိန်ညှိရန် ၎င်းတို့ကို ပြင်ဆင်ပါ။

ထို့အပြင်၊ အလွန်ဆွဲဆောင်မှုရှိသော image to image option ကိုကျွန်ုပ်တို့အသုံးမပြုနိုင်ပါ။

ဒီကနေဝင်ကြည့်လို့ရပါတယ်။ https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

ကျွန်ုပ်တို့တွင် အရွယ်ရောက်ပြီးသူပုံများအတွက် စစ်ထုတ်မှုတစ်ခု၊ ကျော်ကြားသော NSFW ရှိသည်၊ သို့သော် ဤကုဒ်ကို အသုံးပြု၍ ၎င်းကို ပိတ်နိုင်သည်၊ ဆိုလိုသည်မှာ၊ စာရွက်စာတမ်းအတွင်းရှိ ဆဲလ်တစ်ခုဖန်တီးခြင်း၊

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

အချုပ်ခန်းနောက်မှာ ထားရပါမယ်။

pipe = pipe.to("cuda")

က run ပါ

Colab Stable Diffusion Infinity

ဤ Colab တွင် ကျွန်ုပ်တို့သည် ပုံများကို ပြီးမြောက်ရန် ခွင့်ပြုသည့် Infinity tool ကို သုံးနိုင်သည်။ ရှိပြီးသားပုံမှ အကြောင်းအရာကို ဖန်တီးပါ။ တကယ့် pass ပါ။

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

Stable Diffusion နှင့်အတူ Dreamboth

၎င်းသည် လူတစ်ဦး၏ပုံအနည်းငယ်မှနေ၍ သရုပ်ပြသည့်မျက်နှာဖြင့် ပုဂ္ဂိုလ်ရေးသီးသန့်ရလဒ်များရရှိရန် ခွင့်ပြုသည့် Stable Diffusion ဖြင့် Google ၏ Dreamboth ကို အကောင်အထည်ဖော်ခြင်းဖြစ်သည်။

ပုံများကို စိတ်ကြိုက်ပြင်ဆင်ရန် အံ့သြဖွယ်နည်းလမ်းတစ်ခု

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

အခြား Colabs များ

Colab မှာ ဘယ်လိုအလုပ်လုပ်ရမယ်ဆိုတာ သင်သိပြီးပြီ၊ သင်ရှာနေတဲ့ တခြားသူတွေကို ထားခဲ့လိုက်မယ် ဒါမှ သင်အနှစ်သက်ဆုံးကို သုံးနိုင်မှာပါ။ လိုချင်ရင် ကော်ပီကူးပြီး ကိုယ့်စိတ်ကြိုက်ဗားရှင်းနဲ့ ပြင်ဆင်နိုင်ပါတယ်။

၎င်း၏တရားဝင်ဝက်ဘ်ဆိုက်မှ

OpenAI တွင် Dall-e 2 ကို သင်အသုံးပြုသကဲ့သို့ ၎င်းကိုအသုံးပြုရန် ရိုးရှင်းသောနည်းလမ်းဖြစ်သော်လည်း အကယ်၍ သင်သည် ပလပ်ဖောင်းကိုအသုံးပြုပါက ဝန်ဆောင်မှုကို ပေးဆောင်ရမည်ဖြစ်သည်။ https://stability.ai/

HuggingFace မှ

၎င်းကို လျင်မြန်စွာစမ်းသပ်ပြီး ဓာတ်ပုံအချို့ရိုက်ရန် စိတ်ဝင်စားစရာကောင်းသည့် ရွေးချယ်မှုတစ်ခု၊ ၎င်းသည် မည်သို့အလုပ်လုပ်သည်ကိုကြည့်ရန်သာဖြစ်ပြီး၊ ဤအရာကို အလေးအနက်ထားမည်ဆိုပါက ကျွန်ုပ်တို့အသုံးပြုမည့် ရွေးချယ်စရာများစွာရှိသည်။

https://huggingface.co/spaces/stabilityai/stable-diffusion

AWS သို့မဟုတ် Cloud ဝန်ဆောင်မှုအချို့ကို အသုံးပြုခြင်း။

Stable Diffusion model ကို cloud ရှိ hardware တွင် run ခြင်းဖြင့် အသုံးပြုနိုင်ပြီး classic service မှာ Amazon ၏ AWS ဖြစ်သည်။ လောလောဆယ်မှာတော့ မတူညီတဲ့ algorithms တွေနဲ့ အလုပ်လုပ်ဖို့ EC2 instance တွေနဲ့ စမ်းသပ်နေပါတယ်။ ဘယ်လိုဖြစ်တာလဲ ပြောပြမယ်။

အခြားငွေပေးချေမှုဝန်ဆောင်မှုများ

စတော့ဓာတ်ပုံများတွင် အကောင်အထည်ဖော်မှုများမှ APIs များနှင့် ပေါင်းစည်းနိုင်စေမည့် ဝဘ်ဆိုက်များအထိ အများအပြားနှင့် ပိုများလာသည်နှင့်အမျှ ပေါ်ပေါက်လာပါသည်။ အခမဲ့ဝန်ဆောင်မှုများကို ကိုယ်တိုင်ကိုယ်ကျ သုံးနေသော်လည်း၊

အချက်ပြအင်ဂျင်နီယာအတွက် ကိရိယာများ

engineering prompt သည် prompt ၏ မျိုးဆက်ကို ရည်ညွှန်းသည့် အပိုင်းဖြစ်ပြီး၊ ဆိုလိုသည်မှာ၊ ၎င်းသည် ကျွန်ုပ်တို့၏ ပုံများကို ထုတ်ပေးရန်အတွက် မော်ဒယ်ကို ကျွေးသည့် စကားစုဖြစ်သည်။ ၎င်းသည် အသေးအဖွဲကိစ္စမဟုတ်သော်လည်း ရလဒ်ကောင်းများရရှိရန် ၎င်းကို မည်သို့အသုံးပြုရမည်ကို ကောင်းစွာသိထားရန် လိုအပ်ပါသည်။

လေ့လာရန်အလွန်အသုံးဝင်သော tool တစ်ခုဖြစ်သည်။ အဘိဓာန်ပုံများနှင့် ၎င်းတို့အသုံးပြုထားသည့် အချက်ပြမှုများ၊ မျိုးစေ့နှင့် လမ်းညွှန်မှုစကေးတို့ကို ကျွန်ုပ်တို့တွေ့မြင်ရသည့်နေရာ။

သင်ရှာဖွေနေသည့် ရလဒ်အမျိုးအစားကိုရရှိရန် အမှာစာတွင် သင်သတ်မှတ်ပေးရမည့် အစိတ်အပိုင်းအမျိုးအစားများကို သင်ရှာဖွေကြည့်ရှုခြင်းဖြင့် သင်ရှာဖွေနေမည်ဖြစ်သည်။

မှတ်ချက် Leave