Kas yra stabili difuzija, kaip ją įdiegti ir naudoti

vaizdai, sukurti naudojant stabilią sklaidą

Tai yra vienas vadovas, kad sužinotumėte apie stabilią difuziją ir išmokytumėte naudoti šį įrankį.

Aukščiau pateiktas vaizdas sukurtas naudojant stabilią difuziją. Jis buvo sukurtas iš šio teksto (raginimo)

Miesto panorama su dangoraižiais, Stanislavas Sidorovas, skaitmeninis menas, itin tikroviškas, itin detalus, fotorealistinis, 4k, charakterio koncepcija, švelni šviesa, ašmenų bėgis, futuristinis

Stabili difuzija yra teksto į vaizdą mašininio mokymosi modelis. Dirbtinio intelekto gilaus mokymosi modelis, leidžiantis generuoti vaizdus iš teksto, kurį pateikiame kaip įvestį arba įvestį.

Tai ne pirmas modelis ar pirmasis tokio stiliaus įrankis, šiuo metu daug kalbama apie „Dall-e 2“, „MidJourney“, „Google Image“, bet tai yra svarbiausia dėl to, ką jis reprezentuoja. „Stable Diffusion“ yra atvirojo kodo projektas, todėl kiekvienas gali jį naudoti ir modifikuoti. 1.4 versijoje turime 4G .cpxt failą, iš kurio gaunamas visas iš anksto paruoštas modelis, ir tai tikra revoliucija.

Tiek, kad vos per 2 ar 3 savaites nuo jo išleidimo randame „PhotoShop“, „GIMP“, „Krita“, „WordPress“, „Blender“ ir kt. beveik kiekvienas įrankis, kuris pateikiamas su vaizdais, įdiegia stabilią difuziją, todėl net konkurentai, tokie kaip Midjourney, naudoja jį savo įrankiams patobulinti. Tačiau jis naudojamas ne tik įrankiams generuoti, bet mes, kaip vartotojai, galime jį įdiegti savo kompiuteryje ir paleisti, kad gautume vaizdus vietoje.

Nes be to, kad jis yra atvirasis šaltinis, tai nereiškia, kad jis yra mažiau galingas nei ankstesni. Tai tikras stebuklas. Šiuo metu man tai yra geriausias įrankis, kurį galime naudoti, jei norime sukurti vaizdus bet kuriam projektui.

Stabilios difuzijos diegimo ir naudojimo būdai

Yra įvairių būdų jį naudoti. Šiuo metu aš rekomenduoju 2. Jei jūsų kompiuteryje yra reikiamos galios, tai yra vaizdo plokštė su maždaug 8 Gb RAM, tada įdiekite ją į savo kompiuterį. Jei jūsų aparatinė įranga nėra pakankamai galinga, naudokite a „Google Colab“., šiuo metu aš rekomenduoju Altryne, nes jis yra su grafine sąsaja ir yra lengviau naudojamas.

žingsnis į detales.

Colab of Altryne

Tai variantas, kurį rekomenduoju, jei jūsų kompiuteris nėra pakankamai galingas (GPU su 8Gb RAM) arba jei norite išbandyti jį su visomis funkcijomis nieko neįdiegę.

Rekomenduoju, nes ji turi labai patogią grafinę sąsają su daugybe galimybių valdyti vaizdus ir kitus modelio įrankius, tokius kaip vaizdas į vaizdą ir padidinimas.

Mes naudojame „Google Colab“ sukūrė Altryne ir „Google“ diską, kad išsaugotumėte modelį ir rezultatus.

Visa tai nemokama. Palieku viso proceso vaizdo įrašą, kuris, kaip pamatysite, yra labai paprastas.

Įdiekite kompiuteryje

Norėdami jį įdiegti iš kompiuterio, galite vadovautis instrukcijomis, pateiktomis jo „GitHub“, https://github.com/CompVis/stable-diffusion arba jo versija su grafine sąsaja, kuri man patinka daug labiau https://github.com/AUTOMATIC1111/stable-diffusion-webui „Windows“ ir „Linux“ galite naudoti šį vykdomąjį failą, kad jį įdiegtumėte Stabilios sklaidos vartotojo sąsaja v2

Jau žinote, kad norint, kad jis veiktų sklandžiai, jums reikia galingo GPU su mažiausiai 8 GB RAM. Galite priversti jį traukti procesorių, tačiau jis yra daug lėtesnis ir taip pat priklausys nuo jūsų turimo procesoriaus. Taigi, jei jūsų įranga yra sena, turėsite susitaikyti su „Colab“ arba kitu mokėjimo metodu, kad galėtumėte naudoti „Stable Diffusion“

Privalumai turint jį kompiuteryje yra tai, kad juo naudotis daug greičiau, nereikia nieko diegti ar konfigūruoti, užtenka tai padaryti vieną kartą, nuo tada viskas vyksta daug greičiau.

Be to, dar viena priežastis, kodėl man tai labai patinka, yra ta, kad galiu jį integruoti į kitus scenarijus ir išnaudoti sugeneruotus vaizdus, ​​įterpdamas juos tiesiai į užduočių darbo eigą, o tai yra labai svarbus momentas.

Oficialūs Collab difuzoriai

Jis labai panašus į Colab, kurį rekomendavau aukščiau, jis veikia beveik taip pat, modelio įkelti NEREIKIA, bet jis neturi grafinės sąsajos ir norint pakeisti bet kurią parinktį, reikia pakeisti kodo parinktis blokus ir modifikuokite juos, kad pritaikytumėte tai, ko mums reikia.

Be to, negalime naudoti vaizdo į vaizdą parinkties, kuri yra labai patraukli.

Iš čia galite pasiekti https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

Mes turime suaugusiųjų vaizdų filtrą, garsųjį NSFW, tačiau galite jį išjungti naudodami šį kodą, ty sukurdami langelį dokumente su

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

Turite įdėti jį iškart po langeliu

pipe = pipe.to("cuda")

ir paleisk jį

„Colab Stable Diffusion Infinity“.

Šioje „Colab“ programoje galime naudoti „Infinity“ įrankį, kuris leidžia užbaigti vaizdus. Sukurkite turinį iš esamo vaizdo. Tikras perdavimas.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

Dreamboth su stabilia difuzija

Tai yra „Google“ „Dreamboth“ įdiegimas su stabilia difuzija, leidžiančia iš kelių asmens vaizdų gauti suasmenintus rezultatus su tokiu veidu, kaip demonstracinėse versijose.

Nuostabus būdas tinkinti vaizdus

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

Kiti Colabs

Jau žinote, kaip dirbti „Colab“, todėl paliksiu jums kitus, kuriuos rasiu, kad galėtumėte naudoti tą, kuris jums labiausiai patinka. Net jei norite, galite padaryti kopiją ir modifikuoti ją pagal savo skonį, kad gautumėte savo versiją

Iš savo oficialios svetainės

Paprastas būdas jį naudoti, tarsi naudotumėte Dall-e 2 OpenAI, tačiau jei naudojate platformą, paslauga yra mokama. https://stability.ai/

Iš HuggingFace

Įdomi galimybė greitai jį išbandyti ir padaryti keletą nuotraukų, kad pamatytumėte, kaip jis veikia, tačiau yra daug variantų, kuriuos naudosime, jei ketiname rimtai tai spręsti.

https://huggingface.co/spaces/stabilityai/stable-diffusion

Naudojant AWS arba kokią nors debesies paslaugą

„Stable Diffusion“ modelį galima naudoti paleidus jį aparatinėje įrangoje debesyje, klasikinė paslauga yra „Amazon“ AWS. Šiuo metu aš bandau su EC2 egzemplioriais, kad galėčiau dirbti su skirtingais algoritmais. Pasakysiu kaip yra.

Kitos mokėjimo paslaugos

Atsiranda daug ir vis daugiau, nuo diegimų atsarginėse nuotraukose iki svetainių, kurios leidžia mums integruotis su API. Šiuo metu tai patraukė mano dėmesį, nors asmeniškai ketinu naudotis nemokamomis paslaugomis

Greitos inžinerijos įrankiai

Inžinerinis raginimas yra dalis, nurodanti raginimo generavimą, tai yra, frazė, kuria pateikiame modelį, kad jis generuotų mūsų vaizdus. Tai nėra nereikšmingas klausimas, ir jūs turite labai gerai žinoti, kaip jį naudoti, kad gautumėte puikių rezultatų.

Labai naudinga mokymosi priemonė yra leksika, kur matome vaizdus ir raginimą, kurį jie naudojo, sėklą ir orientavimo skalę.

Naršydami aplink jus sužinosite, kokio tipo elementus turite priskirti raginimui, kad gautumėte tokio tipo rezultatą, kurio ieškote.

Komentuoti