എന്താണ് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ, അത് എങ്ങനെ ഇൻസ്റ്റാൾ ചെയ്യുകയും ഉപയോഗിക്കുകയും ചെയ്യാം

സ്ഥിരതയുള്ള വ്യാപനത്തോടെ സൃഷ്ടിച്ച ചിത്രങ്ങൾ

ഇത് ഒന്നാണ് സ്റ്റേബിൾ ഡിഫ്യൂഷനെ കുറിച്ച് പഠിക്കാനും ഈ ടൂൾ എങ്ങനെ ഉപയോഗിക്കാമെന്ന് പഠിപ്പിക്കാനും ഗൈഡ്.

മുകളിലെ ചിത്രം സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ഉപയോഗിച്ചാണ് നിർമ്മിച്ചിരിക്കുന്നത്. ഇത് ഇനിപ്പറയുന്ന വാചകത്തിൽ നിന്ന് സൃഷ്ടിച്ചതാണ് (പ്രോംപ്റ്റ്)

സ്റ്റാനിസ്ലാവ് സിഡോറോവ്, ഡിജിറ്റൽ ആർട്ട്, അൾട്രാ റിയലിസ്റ്റിക്, അൾട്രാ ഡിറ്റൈൽഡ്, ഫോട്ടോറിയലിസ്റ്റിക്, 4 കെ, ക്യാരക്ടർ കൺസെപ്റ്റ്, സോഫ്റ്റ് ലൈറ്റ്, ബ്ലേഡ് റണ്ണർ, ഫ്യൂച്ചറിസ്റ്റിക്

സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ഒരു ടെക്സ്റ്റ്-ടു-ഇമേജ് മെഷീൻ ലേണിംഗ് മോഡലാണ്. നമ്മൾ ഇൻപുട്ടായോ ഇൻപുട്ടായോ ഇട്ട ടെക്‌സ്‌റ്റിൽ നിന്ന് ഇമേജുകൾ സൃഷ്‌ടിക്കാൻ അനുവദിക്കുന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ആഴത്തിലുള്ള പഠന മാതൃക.

ഇത് ഈ ശൈലിയുടെ ആദ്യ മോഡലോ ആദ്യ ഉപകരണമോ അല്ല, ഇപ്പോൾ Dall-e 2, MidJourney, Google ഇമേജ് എന്നിവയെക്കുറിച്ച് ധാരാളം ചർച്ചകൾ നടക്കുന്നുണ്ട്, എന്നാൽ ഇത് പ്രതിനിധീകരിക്കുന്നത് കാരണം ഇത് ഏറ്റവും പ്രധാനപ്പെട്ടതാണ്. സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ഒരു ഓപ്പൺ സോഴ്സ് പ്രോജക്റ്റാണ്, അതിനാൽ ആർക്കും ഇത് ഉപയോഗിക്കാനും പരിഷ്കരിക്കാനും കഴിയും. പതിപ്പ് 1.4-ൽ ഞങ്ങൾക്ക് ഒരു 4G .cpxt ഫയൽ ഉണ്ട്, അവിടെ നിന്ന് മുഴുവൻ മുൻകൂട്ടി പരിശീലിപ്പിച്ച മോഡലും വരുന്നു, ഇത് ഒരു യഥാർത്ഥ വിപ്ലവമാണ്.

പുറത്തിറങ്ങി വെറും രണ്ടോ മൂന്നോ ആഴ്ചകൾക്കുള്ളിൽ, ഫോട്ടോഷോപ്പ്, ജിമ്പ്, കൃത, വേർഡ്പ്രസ്സ്, ബ്ലെൻഡർ മുതലായവയ്ക്കുള്ള പ്ലഗിനുകൾ ഞങ്ങൾ കണ്ടെത്തുന്നു. ചിത്രങ്ങളോടൊപ്പം വരുന്ന എല്ലാ ടൂളുകളും സ്റ്റേബിൾ ഡിഫ്യൂഷൻ നടപ്പിലാക്കുന്നു, അത്രയധികം മിഡ്‌ജോർണി പോലുള്ള എതിരാളികൾ പോലും അവരുടെ ടൂളുകൾ മെച്ചപ്പെടുത്താൻ ഇത് ഉപയോഗിക്കുന്നു. എന്നാൽ ഇത് ടൂളുകൾ സൃഷ്ടിക്കാൻ മാത്രമല്ല ഉപയോഗിക്കുന്നത്, ഉപയോക്താക്കൾ എന്ന നിലയിൽ ഞങ്ങൾക്ക് ഇത് ഞങ്ങളുടെ പിസിയിൽ ഇൻസ്റ്റാൾ ചെയ്യാനും പ്രാദേശികമായി ചിത്രങ്ങൾ ലഭിക്കുന്നതിന് പ്രവർത്തിപ്പിക്കാനും കഴിയും.

കാരണം ഓപ്പൺ സോഴ്‌സ് എന്നതിനപ്പുറം അത് മുമ്പത്തേതിനേക്കാൾ ശക്തി കുറഞ്ഞതാണെന്ന് അർത്ഥമാക്കുന്നില്ല. അതൊരു യഥാർത്ഥ അത്ഭുതമാണ്. എന്നെ സംബന്ധിച്ചിടത്തോളം, ഏതെങ്കിലും പ്രോജക്റ്റിനായി ഞങ്ങളുടെ ഇമേജുകൾ സൃഷ്ടിക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, ഞങ്ങൾക്ക് ഉപയോഗിക്കാൻ കഴിയുന്ന ഏറ്റവും മികച്ച ഉപകരണമാണിത്.

സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ഇൻസ്റ്റാൾ ചെയ്യാനും ഉപയോഗിക്കാനുമുള്ള വഴികൾ

അത് ഉപയോഗിക്കുന്നതിന് വ്യത്യസ്ത മാർഗങ്ങളുണ്ട്. ഇപ്പോൾ ഞാൻ ശുപാർശ ചെയ്യുന്നത് 2. നിങ്ങളുടെ കമ്പ്യൂട്ടറിന് ആവശ്യമായ പവർ ഉണ്ടെങ്കിൽ, അതായത് ഏകദേശം 8Gb റാം ഉള്ള ഒരു ഗ്രാഫിക്സ് കാർഡ്, അത് നിങ്ങളുടെ കമ്പ്യൂട്ടറിൽ ഇൻസ്റ്റാൾ ചെയ്യുക. നിങ്ങളുടെ ഹാർഡ്‌വെയർ വേണ്ടത്ര ശക്തമല്ലെങ്കിൽ a ഉപയോഗിക്കുക Google കൊളാബ്, ഇപ്പോൾ ഞാൻ Altryne ഒന്ന് ശുപാർശ ചെയ്യുന്നു, കാരണം ഇത് ഒരു ഗ്രാഫിക്കൽ ഇന്റർഫേസുമായി വരുന്നതും ഉപയോഗിക്കാൻ എളുപ്പവുമാണ്.

വിശദമായി ഘട്ടം.

കോളാബ് ഓഫ് ആൾട്രിൻ

നിങ്ങളുടെ കമ്പ്യൂട്ടറിന് വേണ്ടത്ര ശക്തിയില്ലെങ്കിൽ (8Gb റാം ഉള്ള GPU) അല്ലെങ്കിൽ ഒന്നും ഇൻസ്റ്റാൾ ചെയ്യാതെ തന്നെ അതിന്റെ എല്ലാ സവിശേഷതകളും ഉപയോഗിച്ച് പരീക്ഷിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ ഞാൻ ശുപാർശ ചെയ്യുന്ന ഓപ്ഷനാണിത്.

ചിത്രങ്ങളും ഇമേജ് ടു ഇമേജും ഉയർന്ന നിലവാരവും പോലുള്ള മറ്റ് മോഡൽ ടൂളുകളും നിയന്ത്രിക്കുന്നതിനുള്ള നിരവധി ഓപ്ഷനുകളുള്ള വളരെ സുഖപ്രദമായ ഗ്രാഫിക്കൽ ഇന്റർഫേസ് ഉള്ളതിനാൽ ഞാൻ ഇത് ശുപാർശ ചെയ്യുന്നു.

ഞങ്ങൾ ഉപയോഗിക്കുന്നു Altryne സൃഷ്ടിച്ച Google കൊളാബ് മോഡലും ഫലങ്ങളും സംരക്ഷിക്കാൻ Google ഡ്രൈവും.

എല്ലാം സൗജന്യമാണ്. മുഴുവൻ പ്രക്രിയയുടെയും ഒരു വീഡിയോ ഞാൻ ഇടുന്നു, അത് നിങ്ങൾ കാണുന്നത് പോലെ വളരെ ലളിതമാണ്.

പിസിയിൽ ഇൻസ്റ്റാൾ ചെയ്യുക

പിസിയിൽ നിന്ന് ഇത് ഇൻസ്റ്റാൾ ചെയ്യാൻ നിങ്ങൾക്ക് അതിന്റെ GitHub-ൽ നൽകിയിരിക്കുന്ന നിർദ്ദേശങ്ങൾ പാലിക്കാം, https://github.com/CompVis/stable-diffusion അല്ലെങ്കിൽ ഞാൻ കൂടുതൽ ഇഷ്ടപ്പെടുന്ന ഗ്രാഫിക്കൽ ഇന്റർഫേസുള്ള അതിന്റെ പതിപ്പിൽ https://github.com/AUTOMATIC1111/stable-diffusion-webui വിൻഡോസിലും ലിനക്സിലും നിങ്ങൾക്ക് ഇത് ഇൻസ്റ്റാൾ ചെയ്യാൻ ഈ എക്സിക്യൂട്ടബിൾ ഉപയോഗിക്കാം സ്ഥിരതയുള്ള ഡിഫ്യൂഷൻ യുഐ v2

സുഗമമായി പ്രവർത്തിക്കുന്നതിന് നിങ്ങൾക്ക് കുറഞ്ഞത് 8Gb റാം ഉള്ള ഒരു ശക്തമായ GPU ആവശ്യമാണെന്ന് നിങ്ങൾക്കറിയാം. നിങ്ങൾക്ക് ഇത് സിപിയു വലിച്ചിടാൻ കഴിയും, പക്ഷേ ഇത് വളരെ സാവധാനത്തിലാണ്, മാത്രമല്ല ഇത് നിങ്ങളുടെ പക്കലുള്ള പ്രോസസറിനെ ആശ്രയിച്ചിരിക്കും. അതിനാൽ നിങ്ങളുടെ ഉപകരണങ്ങൾ പഴയതാണെങ്കിൽ, സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ഉപയോഗിക്കുന്നതിന് കൊളാബ് അല്ലെങ്കിൽ ചില പേയ്‌മെന്റ് രീതികൾ ഉപയോഗിക്കുന്നതിന് നിങ്ങൾ സ്വയം രാജിവെക്കേണ്ടിവരും

ഇത് നിങ്ങളുടെ പിസിയിൽ ഉള്ളതിന്റെ ഗുണങ്ങൾ, അത് ഉപയോഗിക്കാൻ വളരെ വേഗതയുള്ളതാണ്, നിങ്ങൾ ഒന്നും ഇൻസ്റ്റാൾ ചെയ്യുകയോ കോൺഫിഗർ ചെയ്യുകയോ ചെയ്യേണ്ടതില്ല, ഒരു തവണ ചെയ്താൽ മാത്രം മതി, അതിനുശേഷം എല്ലാം വളരെ വേഗത്തിലാണ്.

കൂടാതെ, എനിക്ക് ഇത് വളരെയധികം ഇഷ്ടപ്പെടാനുള്ള മറ്റൊരു കാരണം, എനിക്ക് ഇത് മറ്റ് സ്ക്രിപ്റ്റുകളിലേക്ക് സംയോജിപ്പിക്കാനും ടാസ്‌ക്കുകളുടെ വർക്ക്ഫ്ലോയിലേക്ക് നേരിട്ട് തിരുകിക്കൊണ്ട് ജനറേറ്റുചെയ്‌ത ചിത്രങ്ങൾ പ്രയോജനപ്പെടുത്താനും കഴിയും, ഇത് വളരെ പ്രധാനപ്പെട്ട ഒരു പോയിന്റാണ്.

ഔദ്യോഗിക കൊളാബ് ഡിഫ്യൂസറുകൾ

ഞാൻ മുകളിൽ ശുപാർശ ചെയ്‌ത കൊളാബിനോട് ഇത് വളരെ സാമ്യമുള്ളതാണ്, ഇത് ഏതാണ്ട് സമാനമാണ്, നിങ്ങൾ മോഡൽ അപ്‌ലോഡ് ചെയ്യേണ്ടതില്ല, പക്ഷേ ഇതിന് ഒരു ഗ്രാഫിക്കൽ ഇന്റർഫേസ് ഇല്ല, കൂടാതെ ഏതെങ്കിലും ഓപ്ഷൻ പരിഷ്‌ക്കരിക്കാൻ നിങ്ങൾ കോഡിന്റെ ഓപ്ഷനുകൾ മാറ്റേണ്ടതുണ്ട്. നമുക്ക് ആവശ്യമുള്ളതിലേക്ക് ക്രമീകരിക്കാൻ അവയെ തടയുകയും പരിഷ്ക്കരിക്കുകയും ചെയ്യുക.

കൂടാതെ, ഇമേജ് ടു ഇമേജ് ഓപ്ഷൻ ഉപയോഗിക്കാൻ കഴിയില്ല, അത് വളരെ ആകർഷകമാണ്.

നിങ്ങൾക്ക് ഇതിൽ നിന്ന് ആക്സസ് ചെയ്യാം https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

മുതിർന്നവർക്കുള്ള ചിത്രങ്ങൾക്കായി ഞങ്ങൾക്ക് ഒരു ഫിൽട്ടർ ഉണ്ട്, പ്രശസ്തമായ NSFW, എന്നാൽ ഈ കോഡ് ഉപയോഗിച്ച് നിങ്ങൾക്ക് ഇത് നിർജ്ജീവമാക്കാം, അതായത്, ഡോക്യുമെന്റിൽ ഒരു സെൽ സൃഷ്ടിക്കുന്നു

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

സെല്ലിന് തൊട്ടുപിന്നാലെ നിങ്ങൾ അത് ഇടണം

pipe = pipe.to("cuda")

അത് പ്രവർത്തിപ്പിക്കുക

കൊളാബ് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ ഇൻഫിനിറ്റി

ഈ കൊളാബിൽ നമുക്ക് ഇൻഫിനിറ്റി ടൂൾ ഉപയോഗിക്കാം, അത് ഇമേജുകൾ പൂർത്തിയാക്കാൻ ഞങ്ങളെ അനുവദിക്കുന്നു. നിലവിലുള്ള ചിത്രത്തിൽ നിന്ന് ഉള്ളടക്കം സൃഷ്ടിക്കുക. ഒരു യഥാർത്ഥ പാസ്.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

സ്ഥിരതയുള്ള വ്യാപനത്തോടുകൂടിയ ഡ്രീംബോത്ത്

ഒരു വ്യക്തിയുടെ കുറച്ച് ചിത്രങ്ങളിൽ നിന്ന്, ഡെമോകൾ മുഖേന വ്യക്തിഗതമാക്കിയ ഫലങ്ങൾ നേടാൻ അനുവദിക്കുന്ന സ്ഥിരതയുള്ള വ്യാപനത്തോടുകൂടിയ Google-ന്റെ ഡ്രീംബോത്തിന്റെ നടപ്പാക്കലാണിത്.

ചിത്രങ്ങൾ ഇഷ്ടാനുസൃതമാക്കാനുള്ള ഒരു അത്ഭുതകരമായ മാർഗം

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

മറ്റ് കൊളാബുകൾ

കൊളാബിൽ എങ്ങനെ ജോലി ചെയ്യണമെന്ന് നിങ്ങൾക്കറിയാം, ഞാൻ കണ്ടെത്തുന്ന മറ്റുള്ളവരെ ഞാൻ നിങ്ങൾക്ക് വിട്ടുതരാം, അതിനാൽ നിങ്ങൾക്ക് ഏറ്റവും ഇഷ്ടപ്പെട്ട ഒന്ന് ഉപയോഗിക്കാം. നിങ്ങൾക്ക് വേണമെങ്കിൽ പോലും, നിങ്ങൾക്ക് ഒരു പകർപ്പ് ഉണ്ടാക്കി നിങ്ങളുടെ സ്വന്തം പതിപ്പ് സ്വന്തമാക്കാൻ നിങ്ങളുടെ ഇഷ്ടത്തിനനുസരിച്ച് അത് പരിഷ്കരിക്കാം

അതിന്റെ ഔദ്യോഗിക വെബ്സൈറ്റിൽ നിന്ന്

നിങ്ങൾ OpenAI-യിൽ Dall-e 2 ഉപയോഗിക്കുന്നതുപോലെ, ഇത് ഉപയോഗിക്കാനുള്ള ഒരു ലളിതമായ മാർഗ്ഗം, എന്നാൽ നിങ്ങൾ പ്ലാറ്റ്ഫോം ഉപയോഗിക്കുകയാണെങ്കിൽ സേവനത്തിന് പണം നൽകും. https://stability.ai/

HuggingFace-ൽ നിന്ന്

ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് കാണുന്നതിന്, ഇത് വേഗത്തിൽ പരീക്ഷിക്കാനും കുറച്ച് ചിത്രങ്ങളെടുക്കാനുമുള്ള രസകരമായ ഒരു ഓപ്ഷൻ, എന്നാൽ ഞങ്ങൾ ഇതിനെക്കുറിച്ച് ഗൗരവമായി എടുക്കാൻ പോകുകയാണെങ്കിൽ ഞങ്ങൾ ഉപയോഗിക്കുന്ന നിരവധി ഓപ്ഷനുകൾ ഉണ്ട്.

https://huggingface.co/spaces/stabilityai/stable-diffusion

AWS അല്ലെങ്കിൽ ചില ക്ലൗഡ് സേവനം ഉപയോഗിക്കുന്നു

ക്ലൗഡിലെ ഹാർഡ്‌വെയറിൽ പ്രവർത്തിപ്പിച്ച് സ്റ്റേബിൾ ഡിഫ്യൂഷൻ മോഡൽ ഉപയോഗിക്കാം, ആമസോണിന്റെ AWS ആണ് ഒരു ക്ലാസിക്. വ്യത്യസ്‌ത അൽഗോരിതങ്ങൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കാൻ ഞാൻ ഇപ്പോൾ EC2 ഇൻസ്‌റ്റൻസുകൾ ഉപയോഗിച്ച് പരീക്ഷിക്കുകയാണ്. അതെങ്ങനെയാണെന്ന് ഞാൻ പറയാം.

മറ്റ് പേയ്മെന്റ് സേവനങ്ങൾ

സ്റ്റോക്ക് ഫോട്ടോകളിലെ നിർവ്വഹണങ്ങൾ മുതൽ API-കളുമായി സംയോജിപ്പിക്കാൻ ഞങ്ങളെ അനുവദിക്കുന്ന വെബ്‌സൈറ്റുകൾ വരെ നിരവധി കൂടുതൽ ഉയർന്നുവരുന്നു. ഇപ്പോൾ ഇത് എന്റെ ശ്രദ്ധ ആകർഷിച്ചു, വ്യക്തിപരമായി ഞാൻ സൗജന്യ സേവനങ്ങൾ ഉപയോഗിക്കാൻ പോകുന്നു

പെട്ടെന്നുള്ള എഞ്ചിനീയറിംഗിനുള്ള ഉപകരണങ്ങൾ

പ്രോംപ്റ്റിന്റെ ജനറേഷനെ സൂചിപ്പിക്കുന്ന ഭാഗമാണ് എഞ്ചിനീയറിംഗ് പ്രോംപ്റ്റ്, അതായത്, ഞങ്ങൾ മോഡലിനെ ഫീഡ് ചെയ്യുന്ന വാക്യം, അങ്ങനെ അത് നമ്മുടെ ഇമേജുകൾ സൃഷ്ടിക്കുന്നു. ഇത് ഒരു നിസ്സാര പ്രശ്നമല്ല, മികച്ച ഫലങ്ങൾ ലഭിക്കുന്നതിന് ഇത് എങ്ങനെ ഉപയോഗിക്കണമെന്ന് നിങ്ങൾ നന്നായി അറിഞ്ഞിരിക്കണം.

പഠിക്കാൻ വളരെ ഉപയോഗപ്രദമായ ഒരു ഉപകരണം നിഘണ്ടു, അവിടെ നമ്മൾ ചിത്രങ്ങളും അവ ഉപയോഗിച്ച പ്രോംപ്റ്റും, വിത്തും മാർഗ്ഗനിർദ്ദേശ സ്കെയിലും കാണുന്നു.

നിങ്ങൾക്ക് ചുറ്റും ബ്രൗസുചെയ്യുന്നത്, നിങ്ങൾ തിരയുന്ന തരത്തിലുള്ള ഫലം ലഭിക്കുന്നതിന് പ്രോംപ്റ്റിലേക്ക് ഏതൊക്കെ തരത്തിലുള്ള ഘടകങ്ങളാണ് നൽകേണ്ടതെന്ന് മനസിലാക്കും.

ഒരു അഭിപ്രായം ഇടൂ