X'inhu Diffużjoni Stabbli, kif tinstallaha u tużah

immaġini ġġenerati b'diffużjoni stabbli

Din hija waħda gwida biex titgħallem dwar id-Diffużjoni Stabbli u tgħallem kif tista’ tuża din l-għodda.

L-immaġni ta 'hawn fuq hija ġġenerata b'Diffużjoni Stabbli. Ġie ġġenerat mit-test li ġej (pront)

L-orizzont tal-belt bi skycrapers, minn Stanislav Sidorov, arti diġitali, ultra realistiku, ultra dettaljat, fotorealistiku, 4k, kunċett tal-karattru, dawl artab, blade runner, futuristiku

Diffużjoni Stabbli hija mudell ta 'tagħlim tal-magni minn test għal immaġini. Mudell ta’ tagħlim fil-fond, ta’ intelliġenza artifiċjali li jippermettilna niġġeneraw immaġini minn test li npoġġu bħala input jew input.

Mhux l-ewwel mudell jew l-ewwel għodda ta’ dan l-istil, bħalissa qed titkellem ħafna dwar Dall-e 2, MidJourney, Google Image, iżda hija l-aktar importanti minħabba dak li tirrappreżenta. Stable Diffusion huwa proġett Open Source, għalhekk kulħadd jista' jużah u jimmodifikah. Fil-verżjoni 1.4 għandna fajl 4G .cpxt minn fejn ġej il-mudell kollu mħarreġ minn qabel, u din hija rivoluzzjoni reali.

Tant hu hekk li fi żmien 2 jew 3 ġimgħat biss mill-ħruġ tiegħu, insibu plugins għal PhotoShop, GIMP, Krita, WordPress, Blender, eċċ. kważi kull għodda li tiġi bl-immaġini qed timplimenta Stable Diffusion, tant li anke kompetituri bħal Midjourney qed jużawha biex itejbu l-għodod tagħhom. Iżda mhux biss jintuża biex jiġġenera għodda, iżda aħna bħala utenti nistgħu ninstallawha fuq il-PC tagħna u nħaddmuha biex niksbu l-immaġini lokalment.

Għax minbarra li huwa Open Source ma jfissirx li huwa inqas qawwi minn dawk ta’ qabel. Hija meravilja vera. Għalija bħalissa hija l-aħjar għodda li nistgħu nużaw jekk irridu niġġeneraw l-immaġini tagħna għal kwalunkwe proġett.

Modi kif tinstalla u tuża Diffużjoni Stabbli

Hemm modi differenti biex tużah. Dritt issa nirrakkomanda 2. Jekk il-kompjuter tiegħek għandu l-qawwa meħtieġa, jiġifieri, karta grafika b'madwar 8Gb ta 'RAM, imbagħad installaha fuq il-kompjuter tiegħek. Jekk il-ħardwer tiegħek mhux b'saħħtu biżżejjed uża a Google Collab, bħalissa nirrakkomanda dak Altryne, għax jiġi b'interface grafika u huwa aktar faċli biex tużah.

pass għad-dettall.

Colab ta' Altryne

Din hija l-għażla li nirrakkomanda jekk il-kompjuter tiegħek ma jkunx b'saħħtu biżżejjed (GPU bi 8Gb ta 'RAM) jew jekk trid tipprovaha bil-karatteristiċi kollha tagħha mingħajr ma jkollok tinstalla xejn.

Nirrakkomandaha għax għandha interface grafika komda ħafna b'ħafna għażliet biex tikkontrolla l-immaġini u għodod mudell oħra bħal immaġini għal immaġni u upscale.

Aħna nużaw il- Google colab maħluqa minn Altryne u Google Drive biex issalva l-mudell u r-riżultati.

huwa kollox b'xejn. Inħalli video tal-proċess kollu li kif se taraw huwa sempliċi ħafna.

Installa fuq PC

Biex tinstallah mill-PC tista 'ssegwi l-istruzzjonijiet mogħtija fil-GitHub tagħha, https://github.com/CompVis/stable-diffusion jew fil-verżjoni tiegħu b'interface grafika li jogħġobni ħafna aktar https://github.com/AUTOMATIC1111/stable-diffusion-webui u fuq twieqi u linux tista' tuża dan l-eżekutibbli biex tinstallah Stabbli Diffusion UI v2

Diġà taf li għandek bżonn GPU b'saħħitha b'minimu ta '8Gb ta' RAM biex taħdem bla xkiel. Tista 'tagħmilha tiġbed CPU, iżda hija ħafna aktar bil-mod u tiddependi wkoll fuq il-proċessur li għandek. Mela jekk it-tagħmir tiegħek huwa antik, ikollok tirriżenja ruħek li tuża Colab jew xi metodu ta' ħlas biex tuża Stable Diffusion

Il-vantaġġi li jkollok fuq il-PC tiegħek hija li hija ħafna aktar mgħaġġla biex tużah, m'għandekx għalfejn tinstalla jew tikkonfigura xejn, li tagħmel dan darba biss huwa biżżejjed, minn dakinhar 'il quddiem kollox huwa ħafna aktar mgħaġġel.

Ukoll, raġuni oħra għaliex jogħġobni ħafna hija għaliex nista 'nintegraha fi skripts oħra u nieħu vantaġġ mill-immaġini ġġenerati billi ndaħħalhom direttament fil-fluss tax-xogħol tal-kompiti, li huwa punt importanti ħafna.

Diffusers ta' kollaborazzjoni uffiċjali

Huwa simili ħafna għall-Colab li rrakkomandajt hawn fuq, taħdem kważi l-istess, M'għandekx għalfejn ittella' l-mudell, iżda m'għandhiex interface grafika u biex timmodifika kwalunkwe għażla trid tibdel l-għażliet tal-kodiċi blokki u timmodifikahom biex taġġustah għal dak li għandna bżonn.

Barra minn hekk, ma nistgħux nużaw l-għażla immaġini għal immaġni, li hija attraenti ħafna.

Tista' taċċessa minn dan https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

Għandna filtru għall-immaġini għall-adulti, il-famuż NSFW, iżda tista 'tiddiżattivah billi tuża dan il-kodiċi, jiġifieri, toħloq ċellula fid-dokument b'

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

Int trid tpoġġiha eżatt wara ċ-ċellula

pipe = pipe.to("cuda")

u mexxiha

Colab Stabbli Diffużjoni Infinity

F'dan il-Colab nistgħu nużaw l-għodda Infinity, li tippermettilna nlestu immaġini. Oħloq kontenut mill-immaġni eżistenti. Pass veru.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

Dreambot b'Diffużjoni Stabbli

Din hija l-implimentazzjoni ta 'Dreamboth ta' Google b'Diffużjoni Stabbli li tippermetti, minn ftit immaġini ta 'persuna, li tikseb riżultati personalizzati bil-wiċċ li d-demos.

Mod aqwa biex tippersonalizza l-immaġini

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

Colabs oħra

Diġà taf taħdem fil-Colab, sew inħallik oħrajn li qed insib biex tkun tista' tuża l-iktar waħda li togħġobkom. Anke jekk trid tista' tagħmel kopja u timmodifikaha kif tixtieq tiegħek biex ikollok il-verżjoni tiegħek

Mill-websajt uffiċjali tagħha

Mod sempliċi biex tużah, bħallikieku tuża Dall-e 2 f'OpenAI, imma jekk tuża l-pjattaforma s-servizz jitħallas. https://stability.ai/

Minn HuggingFace

Għażla interessanti biex tittestjaha malajr u tieħu xi ritratti, biss biex tara kif taħdem, iżda hemm ħafna għażliet li se nużaw jekk se nkunu serji dwar dan.

https://huggingface.co/spaces/stabilityai/stable-diffusion

Tuża AWS jew xi servizz Cloud

Il-mudell tad-Diffużjoni Stabbli jista 'jintuża billi jitħaddem fuq ħardwer fil-cloud, servizz klassiku huwa l-AWS ta' Amazon. Bħalissa qed nittestja b'istanzi EC2 biex naħdem b'algoritmi differenti. Jien ngħidlek kif inhi.

Servizzi oħra ta' ħlas

Hemm ħafna u aktar u aktar qed jitfaċċaw, minn implimentazzjonijiet fir-ritratti tal-istokk għal websajts li jippermettulna nintegraw mal-APIs. Bħalissa dan ġibdili l-attenzjoni, għalkemm personalment se nuża s-servizzi b'xejn

Għodda għall-inġinerija fil-pront

Il-pront tal-inġinerija hija l-parti li tirreferi għall-ġenerazzjoni tal-pront, jiġifieri, il-frażi li biha nimxu l-mudell sabiex jiġġenera l-immaġini tagħna. Mhijiex kwistjoni trivjali u trid tkun taf tajjeb ħafna kif tużaha biex tikseb riżultati kbar.

Għodda utli ħafna biex titgħallem hija lessiku, fejn naraw immaġini u l-pront li użaw, iż-żerriegħa u l-iskala ta 'gwida.

Ibbrawżja madwar inti titgħallem liema tip ta 'elementi għandek tassenja lill-pront biex tikseb it-tip ta' riżultat li qed tfittex.

Ħalli kumment