Usambazaji thabiti ni nini, jinsi ya kusanikisha na kuitumia

picha zinazozalishwa na uenezaji thabiti

Hii ni moja mwongozo wa kujifunza kuhusu Usambazaji Imara na kufundisha jinsi unavyoweza kutumia zana hii.

Picha iliyo hapo juu inatolewa na Usambazaji Imara. Imetolewa kutoka kwa maandishi yafuatayo (haraka)

Anga ya anga ya jiji yenye skycrapers, iliyoandikwa na Stanislav Sidorov, sanaa ya kidijitali, uhalisia wa hali ya juu, maelezo ya kina, uhalisia wa picha, 4k, dhana ya mhusika, mwanga mwepesi, mkimbiaji wa blade, futuristic

Usambazaji Imara ni modeli ya kujifunza kutoka kwa maandishi hadi kwa picha. Muundo wa kina wa kujifunza, wa akili bandia unaoturuhusu kutoa picha kutoka kwa maandishi ambayo tunaweka kama ingizo au ingizo.

Sio mfano wa kwanza au chombo cha kwanza cha mtindo huu, hivi sasa kuna mazungumzo mengi kuhusu Dall-e 2, MidJourney, Google Image, lakini ni muhimu zaidi kwa sababu ya kile kinachowakilisha. Usambazaji Imara ni mradi wa Open Source, kwa hivyo mtu yeyote anaweza kuutumia na kuurekebisha. Katika toleo la 1.4 tuna faili ya .cpxt ya 4G ambapo mtindo mzima wa mafunzo ya awali unatoka, na haya ni mapinduzi ya kweli.

Kiasi kwamba katika wiki 2 au 3 tu tangu kutolewa kwake, tunapata programu-jalizi za PhotoShop, GIMP, Krita, WordPress, Blender, n.k. karibu kila zana inayokuja na picha inatekeleza Usambazaji Imara, kiasi kwamba hata washindani kama Midjourney wanaitumia kuboresha zana zao. Lakini haitumiki tu kutengeneza zana, lakini sisi kama watumiaji tunaweza kuisakinisha kwenye Kompyuta yetu na kuiendesha ili kupata picha ndani ya nchi.

Kwa sababu pamoja na kuwa Open Source haimaanishi kuwa ina nguvu kidogo kuliko zile zilizopita. Ni ajabu ya kweli. Kwangu sasa hivi ni zana bora zaidi ambayo tunaweza kutumia ikiwa tunataka kutoa picha zetu kwa mradi wowote.

Njia za kufunga na kutumia Diffusion Imara

Kuna njia tofauti za kuitumia. Hivi sasa ninapendekeza 2. Ikiwa kompyuta yako ina nguvu muhimu, yaani, kadi ya graphics yenye kuhusu 8Gb ya RAM, kisha uiweka kwenye kompyuta yako. Ikiwa maunzi yako hayana nguvu ya kutosha tumia a Ushirikiano wa Google, hivi sasa ninapendekeza Altryne moja, kwa sababu inakuja na kiolesura cha picha na ni rahisi kutumia.

hatua kwa undani.

Colab ya Altryne

Hili ndilo chaguo ambalo ninapendekeza ikiwa kompyuta yako haina nguvu ya kutosha (GPU na 8Gb ya RAM) au ikiwa unataka kujaribu na vipengele vyake vyote bila kusakinisha chochote.

Ninaipendekeza kwa sababu ina kiolesura cha kielelezo kizuri sana chenye chaguo nyingi za kudhibiti picha na zana zingine za kielelezo kama vile picha kwa picha na kiwango cha juu.

Tunatumia Google colab iliyoundwa na Altryne na Hifadhi ya Google ili kuhifadhi muundo na matokeo.

yote ni bure. Ninaacha video ya mchakato mzima ambayo utaona ni rahisi sana.

Weka kwa PC

Ili kuiweka kutoka kwa PC unaweza kufuata maagizo yaliyotolewa katika GitHub yake, https://github.com/CompVis/stable-diffusion au katika toleo lake na kiolesura cha picha ambacho napenda zaidi https://github.com/AUTOMATIC1111/stable-diffusion-webui na kwenye windows na linux unaweza kutumia hii inayoweza kutekelezwa kuisanikisha UI thabiti wa Usambazaji v2

Tayari unajua kwamba unahitaji GPU yenye nguvu na angalau 8Gb ya RAM ili ifanye kazi vizuri. Unaweza kuifanya ivute CPU, lakini ni polepole zaidi na itategemea pia kichakataji ulicho nacho. Kwa hivyo ikiwa kifaa chako ni cha zamani itabidi ujiondoe kutumia Colab au njia fulani ya malipo ili kutumia Usambazaji Ulio thabiti.

Faida za kuwa nayo kwenye PC yako ni kwamba ni ya haraka zaidi kutumia, si lazima kusakinisha au kusanidi chochote, kuifanya mara moja tu inatosha, kuanzia hapo kila kitu ni haraka zaidi.

Pia, sababu nyingine kwa nini ninaipenda sana ni kwa sababu ninaweza kuiunganisha kwenye maandiko mengine na kuchukua fursa ya picha zinazozalishwa kwa kuziingiza moja kwa moja kwenye mtiririko wa kazi, ambayo ni hatua muhimu sana.

Visambazaji Rasmi vya Kushirikiana

Ni sawa na Colab ambayo nimependekeza hapo juu, inakaribia sawa, sio lazima upakie mfano, lakini haina kielelezo cha picha na kurekebisha chaguo lolote lazima ubadilishe chaguzi za nambari. huzuia na kuzirekebisha ili kuirekebisha kwa kile tunachohitaji.

Kwa kuongeza, hatuwezi kutumia picha kwa chaguo la picha, ambalo linavutia sana.

Unaweza kufikia kutoka kwa hii https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

Tuna kichungi cha picha za watu wazima, NSFW maarufu, lakini unaweza kuizima kwa kutumia nambari hii, ambayo ni, kuunda seli kwenye hati na

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

Unapaswa kuiweka mara baada ya seli

pipe = pipe.to("cuda")

na iendesha

Colab Imara Diffusion Infinity

Katika Colab hii tunaweza kutumia zana ya Infinity, ambayo huturuhusu kukamilisha picha. Unda maudhui kutoka kwa picha iliyopo. Pasi ya kweli.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

Dreamboth na Usambazaji Imara

Huu ni utekelezaji wa Dreamboth ya Google yenye Usambazaji Imara ambao unaruhusu, kutoka kwa picha chache za mtu, kupata matokeo yaliyobinafsishwa kwa uso unaofanana na onyesho.

Njia ya kushangaza ya kubinafsisha picha

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

Colabs Nyingine

Tayari unajua jinsi ya kufanya kazi huko Colab, nitakuachia zingine ambazo ninapata ili utumie ile unayopenda zaidi. Hata ukitaka unaweza kutengeneza nakala na kuirekebisha kwa kupenda kwako ili kuwa na toleo lako mwenyewe

Kutoka kwa tovuti yake rasmi

Njia rahisi ya kuitumia, kana kwamba unatumia Dall-e 2 katika OpenAI, lakini ukitumia jukwaa huduma hulipwa. https://stability.ai/

Kutoka kwa HuggingFace

Chaguo la kuvutia la kuipima haraka na kuchukua picha, ili tu kuona jinsi inavyofanya kazi, lakini kuna chaguo nyingi ambazo tutatumia ikiwa tutazingatia hili.

https://huggingface.co/spaces/stabilityai/stable-diffusion

Kwa kutumia AWS au huduma fulani ya Wingu

Mfano wa Usambazaji Imara unaweza kutumika kwa kuiendesha kwenye maunzi kwenye wingu, huduma ya kawaida ni AWS ya Amazon. Hivi sasa ninajaribu na hali za EC2 kufanya kazi na algorithms tofauti. Nitakuambia jinsi ilivyo.

Huduma zingine za malipo

Kuna mengi na zaidi yanajitokeza, kutoka kwa utekelezaji katika picha za hisa hadi tovuti zinazoturuhusu kuunganishwa na API. Kwa sasa hili limevutia umakini wangu, ingawa mimi binafsi nitatumia huduma za bure

Zana za uhandisi wa haraka

Kidokezo cha uhandisi ni sehemu ambayo inarejelea kizazi cha haraka, yaani, maneno ambayo tunalisha mfano ili kuunda picha zetu. Sio suala dogo na lazima ujue vizuri jinsi ya kuitumia kupata matokeo mazuri.

Chombo muhimu sana cha kujifunza ni leksimu, ambapo tunaona picha na haraka ambazo wametumia, mbegu na mizani ya mwongozo.

Kuvinjari kote utajifunza ni aina gani ya vipengele unapaswa kukabidhi kwa kidokezo ili kupata aina ya matokeo unayotafuta.

Acha maoni