Dyma un canllaw i ddysgu am Stable Diffusion ac addysgu sut y gallwch ddefnyddio'r offeryn hwn.
Cynhyrchir y ddelwedd uchod gyda Stable Trylediad. Fe'i cynhyrchwyd o'r testun canlynol (ysgogol)
Gorwel y ddinas gyda skycrapers, gan Stanislav Sidorov, celf ddigidol, hynod realistig, manwl iawn, ffotorealistig, 4k, cysyniad cymeriad, golau meddal, rhedwr llafn, dyfodolaidd
Mae Stable Diffusion yn fodel dysgu peiriant testun-i-ddelwedd. Model dysgu dwfn, o ddeallusrwydd artiffisial sy'n ein galluogi i gynhyrchu delweddau o destun rydyn ni'n eu rhoi fel mewnbwn neu fewnbwn.
Nid dyma'r model cyntaf nac offeryn cyntaf yr arddull hon, ar hyn o bryd mae llawer o sôn am Dall-e 2, MidJourney, Google Image, ond dyma'r pwysicaf oherwydd yr hyn y mae'n ei gynrychioli. Mae Stable Diffusion yn brosiect Ffynhonnell Agored, felly gall unrhyw un ei ddefnyddio a'i addasu. Yn fersiwn 1.4 mae gennym ffeil .cpxt 4G o ble mae'r model cyfan sydd wedi'i hyfforddi ymlaen llaw yn dod, ac mae hwn yn chwyldro go iawn.
Yn gymaint felly, mewn dim ond 2 neu 3 wythnos ers ei ryddhau, rydym yn dod o hyd i ategion ar gyfer PhotoShop, GIMP, Krita, WordPress, Blender, ac ati. Mae bron pob teclyn sy'n dod gyda delweddau yn gweithredu Stable Diffusion, cymaint fel bod hyd yn oed cystadleuwyr fel Midjourney yn ei ddefnyddio i wella eu hoffer. Ond nid yn unig y caiff ei ddefnyddio i gynhyrchu offer, ond gallwn ni fel defnyddwyr ei osod ar ein cyfrifiadur personol a'i redeg i gael y delweddau'n lleol.
Oherwydd yn ogystal â bod yn Ffynhonnell Agored nid yw'n golygu ei fod yn llai pwerus na'r rhai blaenorol. Mae'n wir ryfeddod. I mi ar hyn o bryd dyma'r offeryn gorau y gallwn ei ddefnyddio os ydym am gynhyrchu ein delweddau ar gyfer unrhyw brosiect.
Ffyrdd o osod a defnyddio Stable Diffusion
Mae yna wahanol ffyrdd i'w ddefnyddio. Ar hyn o bryd rwy'n argymell 2. Os oes gan eich cyfrifiadur y pŵer angenrheidiol, hynny yw, cerdyn graffeg gyda tua 8Gb o RAM, yna gosodwch ef ar eich cyfrifiadur. Os nad yw eich caledwedd yn ddigon pwerus defnyddiwch a Google Collab, ar hyn o bryd rwy'n argymell yr un Altryne, oherwydd mae'n dod â rhyngwyneb graffigol ac mae'n haws ei ddefnyddio.
cam i fanylion.
Colab o Altryne
Dyma'r opsiwn yr wyf yn ei argymell os nad yw'ch cyfrifiadur yn ddigon pwerus (GPU gyda 8Gb o RAM) neu os ydych chi am roi cynnig arno gyda'i holl nodweddion heb orfod gosod unrhyw beth.
Rwy'n ei argymell oherwydd bod ganddo ryngwyneb graffigol cyfforddus iawn gyda llawer o opsiynau i reoli'r delweddau ac offer model eraill fel delwedd i ddelwedd a upscale.
Rydym yn defnyddio'r Colab Google wedi'i greu gan Altryne a Google Drive i achub y model a'r canlyniadau.
mae'r cyfan am ddim. Rwy'n gadael fideo o'r broses gyfan sydd fel y gwelwch yn syml iawn.
Gosod ar PC
Er mwyn ei osod o PC gallwch ddilyn y cyfarwyddiadau a roddir yn ei GitHub, https://github.com/CompVis/stable-diffusion neu yn ei fersiwn gyda rhyngwyneb graffigol yr wyf yn hoffi llawer mwy https://github.com/AUTOMATIC1111/stable-diffusion-webui ac ar ffenestri a linux gallwch ddefnyddio'r gweithredadwy hwn i'w osod UI Trylediad Sefydlog v2
Rydych chi eisoes yn gwybod bod angen GPU pwerus arnoch chi gydag o leiaf 8Gb o RAM er mwyn iddo weithio'n llyfn. Gallwch wneud iddo dynnu CPU, ond mae'n llawer arafach a bydd hefyd yn dibynnu ar y prosesydd sydd gennych. Felly os yw'ch offer yn hen bydd yn rhaid i chi roi'r gorau i ddefnyddio Colab neu ryw ddull talu i ddefnyddio Stable Diffusion
Manteision ei gael ar eich cyfrifiadur personol yw ei fod yn llawer cyflymach i'w ddefnyddio, nid oes rhaid i chi osod na ffurfweddu unrhyw beth, mae gwneud hynny unwaith yn ddigon, o hynny ymlaen mae popeth yn llawer cyflymach.
Hefyd, rheswm arall pam rwy'n ei hoffi'n fawr yw oherwydd y gallaf ei integreiddio i sgriptiau eraill a manteisio ar y delweddau a gynhyrchir trwy eu mewnosod yn uniongyrchol i lif gwaith y tasgau, sy'n bwynt pwysig iawn.
Tryledwyr Collab Swyddogol
Mae'n debyg iawn i'r Colab yr wyf wedi argymell uchod, mae'n rhedeg bron yr un peth, NID oes rhaid i chi uwchlwytho'r model, ond nid oes ganddo ryngwyneb graffigol ac i addasu unrhyw opsiwn mae'n rhaid i chi newid opsiynau'r cod blociau a'u haddasu i'w haddasu i'r hyn sydd ei angen arnom .
Yn ogystal, ni allwn ddefnyddio'r opsiwn delwedd i ddelwedd, sy'n ddeniadol iawn.
Gallwch gael mynediad o hwn https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb
Mae gennym hidlydd ar gyfer delweddau oedolion, yr NSFW enwog, ond gallwch ei ddadactifadu gan ddefnyddio'r cod hwn, hynny yw, creu cell yn y ddogfen gyda
def dummy_checker(images, **kwargs): return images, False http://pipe.safety_checker = dummy_checker
Mae'n rhaid i chi ei unioni ar ôl y gell
pipe = pipe.to("cuda")
a'i redeg
Anfeidroldeb Trylediad Sefydlog Colab
Yn y Colab hwn gallwn ddefnyddio'r offeryn Anfeidredd, sy'n ein galluogi i gwblhau delweddau. Creu cynnwys o'r ddelwedd bresennol. Pas go iawn.
Dreamboth gyda Trylediad Sefydlog
Mae hyn yn gweithredu Google Dreamboth gyda Stable Diffusion sy'n caniatáu, o ychydig o ddelweddau o berson, i gael canlyniadau personol gyda wyneb y demos.
Ffordd anhygoel o addasu delweddau
https://github.com/XavierXiao/Dreambooth-Stable-Diffusion
Colabs Eraill
Rydych chi'n gwybod sut i weithio yn Colab yn barod, wel fe adawaf rai eraill yr wyf yn dod o hyd iddynt er mwyn i chi allu defnyddio'r un yr ydych yn ei hoffi fwyaf. Hyd yn oed os dymunwch gallwch wneud copi a'i addasu at eich dant i gael eich fersiwn eich hun
- https://colab.research.google.com/drive/1AfAmwLMd_Vx33O9IwY2TmO9wKZ8ABRRa
- https://colab.research.google.com/drive/1Iy-xW9t1-OQWhb0hNxueGij8phCyluOh#scrollTo=B977dVS6AZcL
- Trylediad Sefydlog ar gyfer cywasgu delweddau coll https://colab.research.google.com/drive/1Ci1VYHuFJK5eOX9TB0Mq4NsqkeDrMaaH?usp=sharing
- Gweithredu gyda keras https://colab.research.google.com/drive/1zVTa4mLeM_w44WaFwl7utTaa6JcaH1zK
O'i wefan swyddogol
Ffordd syml o'i ddefnyddio, fel petaech chi'n defnyddio Dall-e 2 yn OpenAI, ond os ydych chi'n defnyddio'r platfform mae'r gwasanaeth yn cael ei dalu. https://stability.ai/
O HuggingFace
Opsiwn diddorol i'w brofi'n gyflym a thynnu rhai lluniau, dim ond i weld sut mae'n gweithio, ond mae yna lawer o opsiynau y byddwn yn eu defnyddio os ydym am fynd o ddifrif ynglŷn â hyn.
https://huggingface.co/spaces/stabilityai/stable-diffusion
Defnyddio AWS neu ryw wasanaeth Cloud
Gellir defnyddio'r model Stable Diffusion trwy ei redeg ar galedwedd yn y cwmwl, gwasanaeth clasurol yw AWS Amazon. Ar hyn o bryd rwy'n profi gydag achosion EC2 i weithio gyda gwahanol algorithmau. Byddaf yn dweud wrthych sut y mae.
Gwasanaethau talu eraill
Mae llawer a mwy yn dod i'r amlwg, o weithrediadau mewn lluniau stoc i wefannau sy'n ein galluogi i integreiddio ag APIs. Ar hyn o bryd mae hyn wedi dal fy sylw, er yn bersonol rydw i'n mynd i ddefnyddio'r gwasanaethau rhad ac am ddim
Offer ar gyfer peirianneg prydlon
Yr ysgogiad peirianneg yw'r rhan sy'n cyfeirio at gynhyrchu'r anogwr, hynny yw, yr ymadrodd yr ydym yn bwydo'r model ag ef fel ei fod yn cynhyrchu ein delweddau. Nid yw'n fater dibwys ac mae'n rhaid i chi wybod yn iawn sut i'w ddefnyddio i gael canlyniadau gwych.
Offeryn defnyddiol iawn i ddysgu yw geiriadur, lle gwelwn ddelweddau a'r ysgogiad a ddefnyddiwyd ganddynt, yr hedyn a'r raddfa arweiniad.
Bydd pori o'ch cwmpas yn dysgu pa fath o elfennau y mae'n rhaid i chi eu neilltuo i'r anogwr i gael y math o ganlyniad rydych chi'n edrych amdano.