Wat ass Stable Diffusion, wéi installéiert a benotzt se

Biller generéiert mat stabiler Diffusioun

Dëst ass een Guide fir iwwer Stable Diffusion ze léieren a léiere wéi Dir dëst Tool benotze kënnt.

D'Bild hei uewen gëtt mat Stable Diffusion generéiert. Et gouf aus dem folgenden Text generéiert (Prompt)

Stadskyline mat Skycrapers, vum Stanislav Sidorov, digital Konscht, ultra realistesch, ultra detailléiert, fotorealistesch, 4k, Charakterkonzept, mëll Liicht, Blade Runner, futuristesch

Stable Diffusion ass en Text-zu-Bild Maschinn Léiermodell. En Deep Learning Modell, vu kënschtlecher Intelligenz, déi eis erlaabt Biller aus Text ze generéieren, déi mir als Input oder Input setzen.

Et ass net den éischte Modell oder dat éischt Tool vun dësem Stil, elo gëtt et vill iwwer Dall-e 2, MidJourney, Google Image geschwat, awer et ass dat wichtegst wéinst deem wat et duerstellt. Stable Diffusion ass en Open Source Projet, sou datt jidderee se benotze kann an änneren. An der Versioun 1.4 hu mir eng 4G .cpxt Datei, wou de ganze Pre-trainéierte Modell kënnt, an dat ass eng richteg Revolutioun.

Sou vill sou datt an nëmmen 2 oder 3 Wochen zënter senger Verëffentlechung, mir Plugins fir PhotoShop, GIMP, Krita, WordPress, Blender, etc. zimlech all Tool dat mat Biller kënnt implementéiert Stable Diffusion, sou vill datt souguer Konkurrenten wéi Midjourney et benotze fir hir Tools ze verbesseren. Awer et gëtt net nëmme benotzt fir Tools ze generéieren, mä mir als Benotzer kënnen et op eisem PC installéieren a lafen fir d'Biller lokal ze kréien.

Well zousätzlech zu Open Source heescht net datt et manner mächteg ass wéi déi virdrun. Et ass e richtege Wonner. Fir mech ass et de Moment dat bescht Tool dat mir benotze kënne wa mir eis Biller fir all Projet wëllen generéieren.

Weeër fir Stable Diffusion z'installéieren an ze benotzen

Et gi verschidde Manéieren et ze benotzen. Grad elo recommandéieren ech 2. Wann Äre Computer déi néideg Kraaft huet, dat ass eng Grafikkaart mat ongeféier 8Gb RAM, da installéiere se op Ärem Computer. Wann Är Hardware net staark genuch ass, benotzt a Google Zesummenaarbecht, Elo recommandéieren ech den Altryne, well et mat enger graphescher Interface kënnt a méi einfach ze benotzen ass.

Schrëtt fir Detail.

Colab vun Altryne

Dëst ass d'Optioun déi ech recommandéieren wann Äre Computer net staark genuch ass (GPU mat 8Gb RAM) oder wann Dir et wëllt probéieren mat all senge Funktiounen ouni eppes ze installéieren.

Ech recommandéieren et well et eng ganz bequem grafesch Interface huet mat villen Optiounen fir d'Biller an aner Modellinstrumenter wéi Bild op Bild an Upscale ze kontrolléieren.

Mir benotzen den Google colab erstallt vum Altryne a Google Drive fir de Modell an d'Resultater ze späicheren.

et ass alles gratis. Ech verloossen e Video vum ganze Prozess dee wéi Dir gesitt ganz einfach ass.

Installéiert op PC

Fir et vum PC z'installéieren, kënnt Dir d'Instruktioune verfollegen, déi a sengem GitHub ginn, https://github.com/CompVis/stable-diffusion oder a senger Versioun mat grafeschen Interface datt ech vill méi gär https://github.com/AUTOMATIC1111/stable-diffusion-webui an op Windows a Linux kënnt Dir dëst ausführbar benotze fir se z'installéieren Stabil Diffusioun UI v2

Dir wësst schonn datt Dir e mächtege GPU brauch mat engem Minimum vun 8Gb RAM fir datt se glat funktionnéiert. Dir kënnt et CPU zéien, awer et ass vill méi lues an et hänkt och vum Prozessor of deen Dir hutt. Also wann Är Ausrüstung al ass, musst Dir Iech demissionéieren fir Colab oder eng Bezuelmethod ze benotzen fir Stabil Diffusioun ze benotzen

D'Virdeeler fir et op Ärem PC ze hunn ass datt et vill méi séier ass ze benotzen, Dir musst näischt installéieren oder konfiguréieren, just eemol ze maachen ass genuch, vun dann un ass alles vill méi séier.

Och en anere Grond firwat ech et vill gär hunn ass well ech et an aner Skripte integréiere kann a vun de generéierte Biller profitéieren andeems se se direkt an de Workflow vun den Aufgaben asetzen, wat e ganz wichtege Punkt ass.

Offiziell Collab Diffusers

Et ass ganz ähnlech dem Colab deen ech uewen recommandéiert hunn, et leeft bal d'selwecht, Dir musst de Modell NET eroplueden, awer et huet keng grafesch Interface a fir all Optioun z'änneren musst Dir d'Optioune vum Code änneren blockéiert a ännert se fir et unzepassen wat mir brauchen.

Zousätzlech kënne mir d'Bild net fir Bildoptioun benotzen, wat ganz attraktiv ass.

Dir kënnt vun dëser Zougang https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

Mir hunn e Filter fir Erwuessene Biller, de berühmten NSFW, awer Dir kënnt et mat dësem Code deaktivéieren, dat heescht eng Zell am Dokument erstellen mat

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

Dir musst et direkt no der Zell setzen

pipe = pipe.to("cuda")

a lafen et

Colab Stabil Diffusioun Infinity

An dësem Colab kënne mir den Infinity Tool benotzen, wat eis erlaabt Biller ze kompletéieren. Erstellt Inhalt aus dem existente Bild. E richtege Pass.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

Dreamboth mat stabiler Diffusioun

Dëst ass d'Ëmsetzung vu Google Dreamboth mat stabiler Diffusioun déi et erlaabt, vun e puer Biller vun enger Persoun, personaliséiert Resultater ze kréien mat dem Gesiicht datt d'Demos.

Eng erstaunlech Manéier fir Biller ze personaliséieren

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

Aner Colabs

Dir wësst schonn wéi Dir am Colab schafft, gutt, ech loossen Iech anerer, déi ech fannen, fir datt Dir deen benotze kënnt deen Dir am léifsten gefält. Och wann Dir wëllt, kënnt Dir eng Kopie maachen an se no Ärem Goût änneren fir Är eege Versioun ze hunn

Vun der offizieller Websäit

Eng einfach Manéier et ze benotzen, wéi wann Dir Dall-e benotzt 2 an OpenAI, mee wann Dir d'Plattform benotzt gëtt de Service bezuelt. https://stability.ai/

Vun HuggingFace

Eng interessant Optioun fir et séier ze testen an e puer Fotoen ze maachen, just fir ze kucken wéi et funktionnéiert, awer et gi vill Optiounen déi mir benotze wa mir seriös iwwer dëst maachen.

https://huggingface.co/spaces/stabilityai/stable-diffusion

Benotzt AWS oder e puer Cloud Service

De Stable Diffusion Modell ka benotzt ginn andeems se op Hardware an der Cloud lafen, e klassesche Service ass Amazon's AWS. De Moment testen ech mat EC2 Instanzen fir mat verschiddenen Algorithmen ze schaffen. Ech soen Iech wéi et ass.

Aner bezuelt Servicer

Et gi vill a méi a méi entstinn, vun Implementatiounen op Stock Fotoen op Websäiten déi eis erlaben mat APIen z'integréieren. Am Moment huet dëst meng Opmierksamkeet gefaangen, obwuel ech perséinlech déi gratis Servicer benotzen

Tools fir prompt Engineering

Den Ingenieursprompt ass den Deel deen op d'Generatioun vun der Prompt bezitt, dat heescht de Saz mat deem mir de Modell fidderen sou datt et eis Biller generéiert. Et ass keen trivial Thema an Dir musst ganz gutt wëssen wéi Dir et benotzt fir super Resultater ze kréien.

E ganz nëtzlecht Tool fir ze léieren ass Lexikon, wou mir Biller gesinn an d'Prompt déi se benotzt hunn, d'Somen an d'Leedungsskala.

Wann Dir ronderëm surft, léiert wéi eng Zort Elementer Dir der Ufro unzeweisen musst fir d'Zort vum Resultat ze kréien deen Dir sicht.

Verloossen e Commentaire