Tai yra vienas vadovas, kad sužinotumėte apie stabilią difuziją ir išmokytumėte naudoti šį įrankį.
Aukščiau pateiktas vaizdas sukurtas naudojant stabilią difuziją. Jis buvo sukurtas iš šio teksto (raginimo)
Miesto panorama su dangoraižiais, Stanislavas Sidorovas, skaitmeninis menas, itin tikroviškas, itin detalus, fotorealistinis, 4k, charakterio koncepcija, švelni šviesa, ašmenų bėgis, futuristinis
Stabili difuzija yra teksto į vaizdą mašininio mokymosi modelis. Dirbtinio intelekto gilaus mokymosi modelis, leidžiantis generuoti vaizdus iš teksto, kurį pateikiame kaip įvestį arba įvestį.
Tai ne pirmas modelis ar pirmasis tokio stiliaus įrankis, šiuo metu daug kalbama apie „Dall-e 2“, „MidJourney“, „Google Image“, bet tai yra svarbiausia dėl to, ką jis reprezentuoja. „Stable Diffusion“ yra atvirojo kodo projektas, todėl kiekvienas gali jį naudoti ir modifikuoti. 1.4 versijoje turime 4G .cpxt failą, iš kurio gaunamas visas iš anksto paruoštas modelis, ir tai tikra revoliucija.
Tiek, kad vos per 2 ar 3 savaites nuo jo išleidimo randame „PhotoShop“, „GIMP“, „Krita“, „WordPress“, „Blender“ ir kt. beveik kiekvienas įrankis, kuris pateikiamas su vaizdais, įdiegia stabilią difuziją, todėl net konkurentai, tokie kaip Midjourney, naudoja jį savo įrankiams patobulinti. Tačiau jis naudojamas ne tik įrankiams generuoti, bet mes, kaip vartotojai, galime jį įdiegti savo kompiuteryje ir paleisti, kad gautume vaizdus vietoje.
Nes be to, kad jis yra atvirasis šaltinis, tai nereiškia, kad jis yra mažiau galingas nei ankstesni. Tai tikras stebuklas. Šiuo metu man tai yra geriausias įrankis, kurį galime naudoti, jei norime sukurti vaizdus bet kuriam projektui.
Stabilios difuzijos diegimo ir naudojimo būdai
Yra įvairių būdų jį naudoti. Šiuo metu aš rekomenduoju 2. Jei jūsų kompiuteryje yra reikiamos galios, tai yra vaizdo plokštė su maždaug 8 Gb RAM, tada įdiekite ją į savo kompiuterį. Jei jūsų aparatinė įranga nėra pakankamai galinga, naudokite a „Google Colab“., šiuo metu aš rekomenduoju Altryne, nes jis yra su grafine sąsaja ir yra lengviau naudojamas.
žingsnis į detales.
Colab of Altryne
Tai variantas, kurį rekomenduoju, jei jūsų kompiuteris nėra pakankamai galingas (GPU su 8Gb RAM) arba jei norite išbandyti jį su visomis funkcijomis nieko neįdiegę.
Rekomenduoju, nes ji turi labai patogią grafinę sąsają su daugybe galimybių valdyti vaizdus ir kitus modelio įrankius, tokius kaip vaizdas į vaizdą ir padidinimas.
Mes naudojame „Google Colab“ sukūrė Altryne ir „Google“ diską, kad išsaugotumėte modelį ir rezultatus.
Visa tai nemokama. Palieku viso proceso vaizdo įrašą, kuris, kaip pamatysite, yra labai paprastas.
Įdiekite kompiuteryje
Norėdami jį įdiegti iš kompiuterio, galite vadovautis instrukcijomis, pateiktomis jo „GitHub“, https://github.com/CompVis/stable-diffusion arba jo versija su grafine sąsaja, kuri man patinka daug labiau https://github.com/AUTOMATIC1111/stable-diffusion-webui „Windows“ ir „Linux“ galite naudoti šį vykdomąjį failą, kad jį įdiegtumėte Stabilios sklaidos vartotojo sąsaja v2
Jau žinote, kad norint, kad jis veiktų sklandžiai, jums reikia galingo GPU su mažiausiai 8 GB RAM. Galite priversti jį traukti procesorių, tačiau jis yra daug lėtesnis ir taip pat priklausys nuo jūsų turimo procesoriaus. Taigi, jei jūsų įranga yra sena, turėsite susitaikyti su „Colab“ arba kitu mokėjimo metodu, kad galėtumėte naudoti „Stable Diffusion“
Privalumai turint jį kompiuteryje yra tai, kad juo naudotis daug greičiau, nereikia nieko diegti ar konfigūruoti, užtenka tai padaryti vieną kartą, nuo tada viskas vyksta daug greičiau.
Be to, dar viena priežastis, kodėl man tai labai patinka, yra ta, kad galiu jį integruoti į kitus scenarijus ir išnaudoti sugeneruotus vaizdus, įterpdamas juos tiesiai į užduočių darbo eigą, o tai yra labai svarbus momentas.
Oficialūs Collab difuzoriai
Jis labai panašus į Colab, kurį rekomendavau aukščiau, jis veikia beveik taip pat, modelio įkelti NEREIKIA, bet jis neturi grafinės sąsajos ir norint pakeisti bet kurią parinktį, reikia pakeisti kodo parinktis blokus ir modifikuokite juos, kad pritaikytumėte tai, ko mums reikia.
Be to, negalime naudoti vaizdo į vaizdą parinkties, kuri yra labai patraukli.
Iš čia galite pasiekti https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb
Mes turime suaugusiųjų vaizdų filtrą, garsųjį NSFW, tačiau galite jį išjungti naudodami šį kodą, ty sukurdami langelį dokumente su
def dummy_checker(images, **kwargs): return images, False http://pipe.safety_checker = dummy_checker
Turite įdėti jį iškart po langeliu
pipe = pipe.to("cuda")
ir paleisk jį
„Colab Stable Diffusion Infinity“.
Šioje „Colab“ programoje galime naudoti „Infinity“ įrankį, kuris leidžia užbaigti vaizdus. Sukurkite turinį iš esamo vaizdo. Tikras perdavimas.
Dreamboth su stabilia difuzija
Tai yra „Google“ „Dreamboth“ įdiegimas su stabilia difuzija, leidžiančia iš kelių asmens vaizdų gauti suasmenintus rezultatus su tokiu veidu, kaip demonstracinėse versijose.
Nuostabus būdas tinkinti vaizdus
https://github.com/XavierXiao/Dreambooth-Stable-Diffusion
Kiti Colabs
Jau žinote, kaip dirbti „Colab“, todėl paliksiu jums kitus, kuriuos rasiu, kad galėtumėte naudoti tą, kuris jums labiausiai patinka. Net jei norite, galite padaryti kopiją ir modifikuoti ją pagal savo skonį, kad gautumėte savo versiją
- https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
- https://colab.research.google.com/drive/1Iy-xW9t1-OQWhb0hNxueGij8phCyluOh#scrollTo=B977dVS6AZcL
- Stabili difuzija, skirta nuostolingam vaizdo suspaudimui https://colab.research.google.com/drive/1Ci1VYHuFJK5eOX9TB0Mq4NsqkeDrMaaH?usp=sharing
- Įgyvendinimas su keras https://colab.research.google.com/drive/1zVTa4mLeM_w44WaFwl7utTaa6JcaH1zK
Iš savo oficialios svetainės
Paprastas būdas jį naudoti, tarsi naudotumėte Dall-e 2 OpenAI, tačiau jei naudojate platformą, paslauga yra mokama. https://stability.ai/
Iš HuggingFace
Įdomi galimybė greitai jį išbandyti ir padaryti keletą nuotraukų, kad pamatytumėte, kaip jis veikia, tačiau yra daug variantų, kuriuos naudosime, jei ketiname rimtai tai spręsti.
https://huggingface.co/spaces/stabilityai/stable-diffusion
Naudojant AWS arba kokią nors debesies paslaugą
„Stable Diffusion“ modelį galima naudoti paleidus jį aparatinėje įrangoje debesyje, klasikinė paslauga yra „Amazon“ AWS. Šiuo metu aš bandau su EC2 egzemplioriais, kad galėčiau dirbti su skirtingais algoritmais. Pasakysiu kaip yra.
Kitos mokėjimo paslaugos
Atsiranda daug ir vis daugiau, nuo diegimų atsarginėse nuotraukose iki svetainių, kurios leidžia mums integruotis su API. Šiuo metu tai patraukė mano dėmesį, nors asmeniškai ketinu naudotis nemokamomis paslaugomis
Greitos inžinerijos įrankiai
Inžinerinis raginimas yra dalis, nurodanti raginimo generavimą, tai yra, frazė, kuria pateikiame modelį, kad jis generuotų mūsų vaizdus. Tai nėra nereikšmingas klausimas, ir jūs turite labai gerai žinoti, kaip jį naudoti, kad gautumėte puikių rezultatų.
Labai naudinga mokymosi priemonė yra leksika, kur matome vaizdus ir raginimą, kurį jie naudojo, sėklą ir orientavimo skalę.
Naršydami aplink jus sužinosite, kokio tipo elementus turite priskirti raginimui, kad gautumėte tokio tipo rezultatą, kurio ieškote.