Stable Diffusion ແມ່ນຫຍັງ, ວິທີການຕິດຕັ້ງແລະນໍາໃຊ້ມັນ

ຮູບພາບທີ່ສ້າງຂຶ້ນດ້ວຍການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງ

ນີ້ແມ່ນ ໜຶ່ງ ຄູ່ມືເພື່ອຮຽນຮູ້ກ່ຽວກັບການແຜ່ກະຈາຍຄົງທີ່ແລະສອນວິທີທີ່ທ່ານສາມາດນໍາໃຊ້ເຄື່ອງມືນີ້.

ຮູບພາບຂ້າງເທິງແມ່ນຖືກສ້າງຂຶ້ນດ້ວຍການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງ. ມັນໄດ້ຖືກສ້າງຂື້ນຈາກຂໍ້ຄວາມຕໍ່ໄປນີ້ (ກະຕຸ້ນ)

ທ້ອງຟ້າຂອງເມືອງທີ່ມີຕຶກສູງ, ໂດຍ Stanislav Sidorov, ສິລະປະດິຈິຕອລ, ເປັນຈິງທີ່ສຸດ, ລາຍລະອຽດທີ່ສຸດ, ຮູບຈິງ, 4k, ແນວຄວາມຄິດລັກສະນະ, ແສງສະຫວ່າງອ່ອນ, ແຜ່ນໃບຄ້າຍຄື, ອະນາຄົດ

Stable Diffusion ເປັນຕົວແບບການຮຽນຮູ້ເຄື່ອງຈັກແບບຂໍ້ຄວາມເປັນຮູບ. ຮູບແບບການຮຽນຮູ້ທີ່ເລິກເຊິ່ງ, ຂອງປັນຍາປະດິດທີ່ຊ່ວຍໃຫ້ພວກເຮົາສາມາດສ້າງຮູບພາບຈາກຂໍ້ຄວາມທີ່ພວກເຮົາໃສ່ເຂົ້າໃນການປ້ອນຂໍ້ມູນຫຼືການປ້ອນຂໍ້ມູນ.

ມັນບໍ່ແມ່ນຮູບແບບທໍາອິດຫຼືເຄື່ອງມືທໍາອິດຂອງຮູບແບບນີ້, ໃນປັດຈຸບັນມີການເວົ້າຫຼາຍກ່ຽວກັບ Dall-e 2, MidJourney, Google Image, ແຕ່ວ່າມັນເປັນສິ່ງສໍາຄັນທີ່ສຸດເນື່ອງຈາກສິ່ງທີ່ມັນເປັນຕົວແທນ. Stable Diffusion ເປັນໂຄງການ Open Source, ດັ່ງນັ້ນທຸກຄົນສາມາດໃຊ້ແລະດັດແປງມັນໄດ້. ໃນຮຸ່ນ 1.4 ພວກເຮົາມີໄຟລ໌ 4G .cpxt ທີ່ຮູບແບບການຝຶກອົບຮົມກ່ອນທັງຫມົດມາຈາກ, ແລະນີ້ແມ່ນການປະຕິວັດທີ່ແທ້ຈິງ.

ຫຼາຍດັ່ງນັ້ນໃນພຽງແຕ່ 2 ຫຼື 3 ອາທິດນັບຕັ້ງແຕ່ການປ່ອຍຕົວຂອງມັນ, ພວກເຮົາຊອກຫາ plugins ສໍາລັບ PhotoShop, GIMP, Krita, WordPress, Blender, ແລະອື່ນໆ. ເກືອບທຸກເຄື່ອງມືທີ່ມາພ້ອມກັບຮູບພາບແມ່ນການປະຕິບັດ Stable Diffusion, ດັ່ງນັ້ນເຖິງແມ່ນວ່າຄູ່ແຂ່ງເຊັ່ນ Midjourney ກໍາລັງໃຊ້ມັນເພື່ອເພີ່ມເຄື່ອງມືຂອງພວກເຂົາ. ແຕ່ມັນບໍ່ພຽງແຕ່ຖືກນໍາໃຊ້ເພື່ອສ້າງເຄື່ອງມື, ແຕ່ພວກເຮົາເປັນຜູ້ໃຊ້ສາມາດຕິດຕັ້ງມັນຢູ່ໃນ PC ຂອງພວກເຮົາແລະດໍາເນີນການເພື່ອໃຫ້ໄດ້ຮູບພາບໃນທ້ອງຖິ່ນ.

ເນື່ອງຈາກວ່ານອກຈາກການເປັນ Open Source ບໍ່ໄດ້ຫມາຍຄວາມວ່າມັນມີຄວາມເຂັ້ມແຂງຫນ້ອຍກ່ວາທີ່ຜ່ານມາ. ມັນເປັນສິ່ງມະຫັດທີ່ແທ້ຈິງ. ສໍາລັບຂ້ອຍໃນປັດຈຸບັນມັນເປັນເຄື່ອງມືທີ່ດີທີ່ສຸດທີ່ພວກເຮົາສາມາດນໍາໃຊ້ໄດ້ຖ້າພວກເຮົາຕ້ອງການສ້າງຮູບພາບຂອງພວກເຮົາສໍາລັບໂຄງການໃດກໍ່ຕາມ.

ວິທີການຕິດຕັ້ງແລະນໍາໃຊ້ Stable Diffusion

ມີວິທີທີ່ແຕກຕ່າງກັນທີ່ຈະໃຊ້ມັນ. ໃນປັດຈຸບັນຂ້າພະເຈົ້າແນະນໍາ 2. ຖ້າຄອມພິວເຕີຂອງທ່ານມີພະລັງງານທີ່ຈໍາເປັນ, ນັ້ນແມ່ນ, ກາດກາຟິກທີ່ມີ RAM ປະມານ 8Gb, ຫຼັງຈາກນັ້ນໃຫ້ຕິດຕັ້ງມັນຢູ່ໃນຄອມພິວເຕີຂອງທ່ານ. ຖ້າຮາດແວຂອງທ່ານບໍ່ມີອໍານາດພຽງພໍໃຫ້ໃຊ້ a Google Collab, ຕອນນີ້ຂ້ອຍຂໍແນະນໍາ Altryne ຫນຶ່ງ, ເພາະວ່າມັນມາພ້ອມກັບການໂຕ້ຕອບແບບກາຟິກແລະງ່າຍຕໍ່ການໃຊ້.

ຂັ້ນ​ຕອນ​ໃນ​ການ​ລາຍ​ລະ​ອຽດ​.

Colab ຂອງ Altryne

ນີ້ແມ່ນທາງເລືອກທີ່ຂ້ອຍແນະນໍາຖ້າຄອມພິວເຕີຂອງທ່ານບໍ່ມີອໍານາດພຽງພໍ (GPU ກັບ 8Gb ຂອງ RAM) ຫຼືຖ້າທ່ານຕ້ອງການລອງມັນດ້ວຍຄຸນສົມບັດທັງຫມົດໂດຍບໍ່ຈໍາເປັນຕ້ອງຕິດຕັ້ງຫຍັງ.

ຂ້າພະເຈົ້າຂໍແນະນໍາມັນເພາະວ່າມັນມີການໂຕ້ຕອບຮູບພາບທີ່ສະດວກສະບາຍຫຼາຍທີ່ມີທາງເລືອກຫຼາຍທີ່ຈະຄວບຄຸມຮູບພາບແລະເຄື່ອງມືແບບຈໍາລອງອື່ນໆເຊັ່ນ: ຮູບພາບກັບຮູບພາບແລະລະດັບສູງ.

ພວກເຮົາໃຊ້ Google colab ສ້າງໂດຍ Altryne ແລະ Google Drive ເພື່ອບັນທຶກແບບຈໍາລອງແລະຜົນໄດ້ຮັບ.

ມັນທັງຫມົດຟຣີ. ຂ້າ​ພະ​ເຈົ້າ​ອອກ​ຈາກ​ວິ​ດີ​ໂອ​ຂອງ​ຂະ​ບວນ​ການ​ທັງ​ຫມົດ​ທີ່​ທ່ານ​ຈະ​ເຫັນ​ແມ່ນ​ງ່າຍ​ດາຍ​ຫຼາຍ​.

ຕິດຕັ້ງໃສ່ PC

ການ​ຕິດ​ຕັ້ງ​ມັນ​ຈາກ PC ທ່ານ​ສາ​ມາດ​ປະ​ຕິ​ບັດ​ຕາມ​ຄໍາ​ແນະ​ນໍາ​ໃຫ້​ຢູ່​ໃນ GitHub ຂອງ​ຕົນ​, https://github.com/CompVis/stable-diffusion ຫຼືໃນສະບັບຂອງມັນທີ່ມີການໂຕ້ຕອບຮູບພາບທີ່ຂ້ອຍມັກຫຼາຍ https://github.com/AUTOMATIC1111/stable-diffusion-webui ແລະໃນ windows ແລະ linux ທ່ານສາມາດນໍາໃຊ້ executable ນີ້ເພື່ອຕິດຕັ້ງມັນ Stable Diffusion UI v2

ທ່ານຮູ້ແລ້ວວ່າທ່ານຕ້ອງການ GPU ທີ່ມີປະສິດທິພາບທີ່ມີ RAM ຕໍ່າສຸດ 8Gb ເພື່ອໃຫ້ມັນເຮັດວຽກໄດ້ອຍ່າງລຽບງ່າຍ. ທ່ານສາມາດເຮັດໃຫ້ມັນດຶງ CPU, ແຕ່ມັນຊ້າກວ່າຫຼາຍແລະມັນຍັງຂຶ້ນກັບໂປເຊດເຊີທີ່ທ່ານມີ. ດັ່ງນັ້ນຖ້າອຸປະກອນຂອງເຈົ້າເກົ່າເຈົ້າຈະຕ້ອງລາອອກຕົວເອງເພື່ອໃຊ້ Colab ຫຼືບາງວິທີການຊໍາລະເງິນເພື່ອໃຊ້ Stable Diffusion.

ຂໍ້ດີຂອງການມີມັນຢູ່ໃນ PC ຂອງທ່ານແມ່ນມັນໄວກວ່າທີ່ຈະໃຊ້ຫຼາຍ, ທ່ານບໍ່ຈໍາເປັນຕ້ອງຕິດຕັ້ງຫຼື configure ຫຍັງ, ພຽງແຕ່ເຮັດມັນຄັ້ງດຽວກໍ່ພຽງພໍ, ຈາກນັ້ນໄປທຸກສິ່ງທຸກຢ່າງແມ່ນໄວຂຶ້ນຫຼາຍ.

ນອກຈາກນີ້, ເຫດຜົນອີກອັນຫນຶ່ງທີ່ຂ້ອຍມັກຫຼາຍແມ່ນຍ້ອນວ່າຂ້ອຍສາມາດປະສົມປະສານມັນເຂົ້າໄປໃນສະຄິບອື່ນໆແລະໃຊ້ປະໂຫຍດຈາກຮູບພາບທີ່ສ້າງຂຶ້ນໂດຍການໃສ່ພວກມັນໂດຍກົງເຂົ້າໃນຂະບວນການເຮັດວຽກຂອງວຽກງານ, ເຊິ່ງເປັນຈຸດສໍາຄັນຫຼາຍ.

Collab Diffusers ຢ່າງເປັນທາງການ

ມັນຄ້າຍຄືກັນກັບ Colab ທີ່ຂ້ອຍໄດ້ແນະ ນຳ ຂ້າງເທິງ, ມັນເຮັດວຽກເກືອບຄືກັນ, ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງອັບໂຫລດຮູບແບບ, ແຕ່ມັນບໍ່ມີການໂຕ້ຕອບແບບກາຟິກແລະເພື່ອດັດແປງທາງເລືອກໃດໆ, ທ່ານຕ້ອງປ່ຽນຕົວເລືອກຂອງລະຫັດ. ຕັນແລະດັດແປງໃຫ້ເຂົາເຈົ້າປັບມັນກັບສິ່ງທີ່ພວກເຮົາຕ້ອງການ.

ນອກຈາກນັ້ນ, ພວກເຮົາບໍ່ສາມາດໃຊ້ຕົວເລືອກຮູບພາບກັບຮູບພາບ, ເຊິ່ງເປັນສິ່ງທີ່ດຶງດູດຫຼາຍ.

ທ່ານ​ສາ​ມາດ​ເຂົ້າ​ເຖິງ​ຈາກ​ນີ້​ https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

ພວກເຮົາມີຕົວກອງສໍາລັບຮູບພາບຜູ້ໃຫຍ່, NSFW ທີ່ມີຊື່ສຽງ, ແຕ່ທ່ານສາມາດປິດມັນໄດ້ໂດຍໃຊ້ລະຫັດນີ້, ນັ້ນແມ່ນ, ການສ້າງຕາລາງໃນເອກະສານດ້ວຍ.

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

ທ່ານຕ້ອງໃສ່ມັນທັນທີຫຼັງຈາກຫ້ອງ

pipe = pipe.to("cuda")

ແລະດໍາເນີນການມັນ

Colab Stable Diffusion Infinity

ໃນ Colab ນີ້ພວກເຮົາສາມາດນໍາໃຊ້ເຄື່ອງມື Infinity, ເຊິ່ງຊ່ວຍໃຫ້ພວກເຮົາເຮັດສໍາເລັດຮູບ. ສ້າງເນື້ອຫາຈາກຮູບພາບທີ່ມີຢູ່. ໃບຜ່ານຕົວຈິງ.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

Dreamboth ທີ່ມີການແຜ່ກະຈາຍຄົງທີ່

ນີ້ແມ່ນການປະຕິບັດຂອງ Dreamboth ຂອງ Google ດ້ວຍການແຜ່ກະຈາຍທີ່ຫມັ້ນຄົງທີ່ອະນຸຍາດໃຫ້, ຈາກຮູບພາບຈໍານວນຫນ້ອຍຫນຶ່ງຂອງບຸກຄົນ, ເພື່ອໃຫ້ໄດ້ຮັບຜົນໄດ້ຮັບສ່ວນບຸກຄົນທີ່ມີໃບຫນ້າທີ່ສາທິດ.

ເປັນວິທີທີ່ປະລາດໃຈທີ່ຈະປັບແຕ່ງຮູບພາບ

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

Colabs ອື່ນໆ

ເຈົ້າຮູ້ວິທີການເຮັດວຽກຢູ່ Colab ແລ້ວ, ຂ້ອຍຈະປ່ອຍໃຫ້ເຈົ້າຄົນອື່ນທີ່ຂ້ອຍຊອກຫາເພື່ອໃຫ້ເຈົ້າສາມາດໃຊ້ອັນທີ່ເຈົ້າມັກທີ່ສຸດ. ເຖິງແມ່ນວ່າທ່ານຕ້ອງການໃຫ້ທ່ານສາມາດເຮັດສໍາເນົາແລະດັດແປງມັນຕາມຄວາມມັກຂອງເຈົ້າເພື່ອໃຫ້ມີສະບັບຂອງຕົນເອງ

ຈາກເວັບໄຊທ໌ທາງການຂອງຕົນ

ວິທີທີ່ງ່າຍດາຍທີ່ຈະໃຊ້ມັນ, ຄືກັບວ່າທ່ານໃຊ້ Dall-e 2 ໃນ OpenAI, ແຕ່ຖ້າທ່ານໃຊ້ແພລະຕະຟອມການບໍລິການແມ່ນຈ່າຍ. https://stability.ai/

ຈາກ HuggingFace

ທາງເລືອກທີ່ຫນ້າສົນໃຈທີ່ຈະທົດສອບມັນຢ່າງໄວວາແລະຖ່າຍຮູບບາງຢ່າງ, ພຽງແຕ່ເພື່ອເບິ່ງວ່າມັນເຮັດວຽກແນວໃດ, ແຕ່ມີຫຼາຍທາງເລືອກທີ່ພວກເຮົາຈະໃຊ້ຖ້າພວກເຮົາຈະເອົາຈິງຈັງກ່ຽວກັບເລື່ອງນີ້.

https://huggingface.co/spaces/stabilityai/stable-diffusion

ໃຊ້ AWS ຫຼືບາງບໍລິການ Cloud

ຮູບແບບການແຜ່ກະຈາຍຄົງທີ່ສາມາດນໍາໃຊ້ໄດ້ໂດຍການແລ່ນມັນຢູ່ໃນຮາດແວໃນຄລາວ, ການບໍລິການຄລາສສິກແມ່ນ Amazon's AWS. ຕອນນີ້ຂ້ອຍກໍາລັງທົດສອບກັບ EC2 instances ເພື່ອເຮັດວຽກກັບ algorithms ທີ່ແຕກຕ່າງກັນ. ຂ້ອຍຈະບອກເຈົ້າວ່າມັນເປັນແນວໃດ.

ການບໍລິການຊໍາລະອື່ນໆ

ມີຫຼາຍແລະຫຼາຍກວ່າແລະຫຼາຍທີ່ພົ້ນເດັ່ນຂື້ນ, ຈາກການປະຕິບັດໃນຮູບຫຼັກຊັບໄປຫາເວັບໄຊທ໌ທີ່ອະນຸຍາດໃຫ້ພວກເຮົາເຊື່ອມໂຍງກັບ APIs. ໃນເວລານີ້, ມັນໄດ້ດຶງດູດຄວາມສົນໃຈຂອງຂ້ອຍ, ເຖິງແມ່ນວ່າຂ້ອຍເອງຈະໃຊ້ບໍລິການຟຣີ

ເຄື່ອງມືສໍາລັບວິສະວະກໍາທັນທີ

ການກະຕຸ້ນທາງວິສະວະກໍາແມ່ນສ່ວນຫນຶ່ງທີ່ຫມາຍເຖິງການຜະລິດການກະຕຸ້ນເຕືອນ, ນັ້ນແມ່ນ, ປະໂຫຍກທີ່ພວກເຮົາລ້ຽງຕົວແບບເພື່ອໃຫ້ມັນສ້າງຮູບພາບຂອງພວກເຮົາ. ມັນ​ບໍ່​ແມ່ນ​ບັນ​ຫາ trivial ແລະ​ທ່ານ​ຕ້ອງ​ຮູ້​ດີ​ຫຼາຍ​ວິ​ທີ​ການ​ນໍາ​ໃຊ້​ມັນ​ເພື່ອ​ໃຫ້​ໄດ້​ຮັບ​ຜົນ​ໄດ້​ຮັບ​ທີ່​ຍິ່ງ​ໃຫຍ່​.

ເຄື່ອງມືທີ່ເປັນປະໂຫຍດຫຼາຍທີ່ຈະຮຽນຮູ້ແມ່ນ ຄຳສັບ, ບ່ອນທີ່ພວກເຮົາເຫັນຮູບພາບແລະການກະຕຸ້ນທີ່ເຂົາເຈົ້າໄດ້ນໍາໃຊ້, ແກ່ນແລະຂະຫນາດຄໍາແນະນໍາ.

ການທ່ອງໄປຮອບໆເຈົ້າຈະຮຽນຮູ້ສິ່ງທີ່ປະເພດຂອງອົງປະກອບທີ່ເຈົ້າຕ້ອງມອບຫມາຍໃຫ້ທັນທີເພື່ອໃຫ້ໄດ້ປະເພດຂອງຜົນໄດ້ຮັບທີ່ເຈົ້າກໍາລັງຊອກຫາ.

Leave a comment