স্টেবল ডিফিউশন কি, কিভাবে ইন্সটল এবং ব্যবহার করতে হয়

স্থিতিশীল বিস্তারের সাথে তৈরি করা ছবি

এটি একটি স্ট্যাবল ডিফিউশন সম্পর্কে জানতে গাইড এবং আপনি কীভাবে এই টুলটি ব্যবহার করতে পারেন তা শেখান.

উপরের ছবিটি স্টেবল ডিফিউশন দিয়ে তৈরি করা হয়েছে। এটি নিম্নলিখিত পাঠ্য থেকে তৈরি করা হয়েছে (প্রম্পট)

স্ট্যানিস্লাভ সিডোরভ দ্বারা স্কাইক্র্যাপার সহ শহরের স্কাইলাইন, ডিজিটাল আর্ট, অতি বাস্তববাদী, অতি বিশদ, ফটোরিয়েলিস্টিক, 4k, চরিত্রের ধারণা, নরম আলো, ব্লেড রানার, ভবিষ্যত

স্টেবল ডিফিউশন হল টেক্সট-টু-ইমেজ মেশিন লার্নিং মডেল। একটি গভীর শিক্ষার মডেল, কৃত্রিম বুদ্ধিমত্তার যা আমাদের পাঠ্য থেকে ছবি তৈরি করতে দেয় যা আমরা ইনপুট বা ইনপুট হিসাবে রাখি।

এটি এই শৈলীর প্রথম মডেল বা প্রথম টুল নয়, এই মুহূর্তে ডাল-ই 2, মিডজার্নি, গুগল ইমেজ সম্পর্কে অনেক কথা বলা হচ্ছে, তবে এটি যা উপস্থাপন করে তার কারণে এটি সবচেয়ে গুরুত্বপূর্ণ। স্টেবল ডিফিউশন একটি ওপেন সোর্স প্রজেক্ট, তাই যে কেউ এটি ব্যবহার করতে এবং পরিবর্তন করতে পারে। সংস্করণ 1.4-এ আমাদের একটি 4G .cpxt ফাইল রয়েছে যেখান থেকে সম্পূর্ণ প্রাক-প্রশিক্ষিত মডেলটি আসে এবং এটি একটি বাস্তব বিপ্লব।

এতটাই যে এটি প্রকাশের মাত্র 2 বা 3 সপ্তাহের মধ্যে, আমরা ফটোশপ, জিআইএমপি, ক্রিটা, ওয়ার্ডপ্রেস, ব্লেন্ডার ইত্যাদির জন্য প্লাগইনগুলি খুঁজে পাই। ইমেজগুলির সাথে আসা প্রায় প্রতিটি সরঞ্জামই স্থিতিশীল ডিফিউশন বাস্তবায়ন করছে, এমনকি মিডজার্নির মতো প্রতিযোগীরা তাদের সরঞ্জামগুলি উন্নত করতে এটি ব্যবহার করছে। কিন্তু এটি শুধুমাত্র টুল তৈরি করতে ব্যবহার করা হয় না, কিন্তু আমরা ব্যবহারকারী হিসেবে এটি আমাদের পিসিতে ইনস্টল করতে পারি এবং স্থানীয়ভাবে ছবিগুলি পেতে এটি চালাতে পারি।

কারণ ওপেন সোর্স হওয়া ছাড়াও এর অর্থ এই নয় যে এটি আগেরগুলির তুলনায় কম শক্তিশালী। এটি একটি সত্য বিস্ময়. আমার জন্য এই মুহূর্তে এটি সেরা টুল যা আমরা ব্যবহার করতে পারি যদি আমরা কোনো প্রকল্পের জন্য আমাদের ছবি তৈরি করতে চাই।

স্ট্যাবল ডিফিউশন ইনস্টল এবং ব্যবহার করার উপায়

এটি ব্যবহার করার বিভিন্ন উপায় আছে। এই মুহূর্তে আমি সুপারিশ করছি 2. যদি আপনার কম্পিউটারে প্রয়োজনীয় শক্তি থাকে, অর্থাৎ, প্রায় 8 গিগাবাইট RAM সহ একটি গ্রাফিক্স কার্ড, তাহলে এটি আপনার কম্পিউটারে ইনস্টল করুন। আপনার হার্ডওয়্যার যথেষ্ট শক্তিশালী না হলে একটি ব্যবহার করুন গুগল কোলাব, এই মুহূর্তে আমি Altryne একটি সুপারিশ করছি, কারণ এটি একটি গ্রাফিকাল ইন্টারফেসের সাথে আসে এবং এটি ব্যবহার করা সহজ৷

বিস্তারিত পদক্ষেপ.

Altryne এর Colab

আপনার কম্পিউটার যথেষ্ট শক্তিশালী না হলে (8Gb RAM এর GPU) না হলে বা আপনি কিছু ইন্সটল না করেই এর সমস্ত বৈশিষ্ট্য সহ এটি চেষ্টা করতে চাইলে আমি এই বিকল্পটি সুপারিশ করি৷

আমি এটি সুপারিশ করছি কারণ এটিতে অনেকগুলি বিকল্প সহ একটি খুব আরামদায়ক গ্রাফিকাল ইন্টারফেস রয়েছে যাতে ছবিগুলি এবং অন্যান্য মডেল টুল যেমন ইমেজ টু ইমেজ এবং আপস্কেল নিয়ন্ত্রণ করা যায়৷

আমরা ব্যবহার করি Altryne দ্বারা তৈরি Google colab এবং মডেল এবং ফলাফল সংরক্ষণ করতে Google ড্রাইভ।

এটা সব বিনামূল্যে. আমি পুরো প্রক্রিয়াটির একটি ভিডিও রেখেছি যা আপনি দেখতে পাবেন খুব সহজ।

পিসিতে ইনস্টল করুন

পিসি থেকে ইন্সটল করতে আপনি এর গিটহাবে দেওয়া নির্দেশাবলী অনুসরণ করতে পারেন, https://github.com/CompVis/stable-diffusion বা গ্রাফিক্যাল ইন্টারফেসের সাথে এর সংস্করণে যা আমি অনেক বেশি পছন্দ করি https://github.com/AUTOMATIC1111/stable-diffusion-webui এবং উইন্ডোজ এবং লিনাক্সে আপনি এটি ইনস্টল করতে এই এক্সিকিউটেবল ব্যবহার করতে পারেন স্থিতিশীল ডিফিউশন UI v2

আপনি ইতিমধ্যেই জানেন যে এটি মসৃণভাবে কাজ করার জন্য আপনার ন্যূনতম 8Gb RAM সহ একটি শক্তিশালী GPU প্রয়োজন৷ আপনি এটিকে সিপিইউ টানতে পারেন, তবে এটি অনেক ধীর এবং এটি আপনার কাছে থাকা প্রসেসরের উপরও নির্ভর করবে। তাই আপনার যন্ত্রপাতি পুরানো হলে আপনাকে Colab ব্যবহার করতে হবে অথবা Stable Diffusion ব্যবহার করার জন্য কিছু অর্থপ্রদানের পদ্ধতি ব্যবহার করতে হবে

এটি আপনার পিসিতে থাকার সুবিধা হল এটি ব্যবহার করা অনেক দ্রুত, আপনাকে কিছু ইন্সটল বা কনফিগার করতে হবে না, শুধু একবার করলেই যথেষ্ট, তারপর থেকে সবকিছুই অনেক দ্রুত।

এছাড়াও, আমি এটিকে অনেক পছন্দ করার আরেকটি কারণ হ'ল আমি এটিকে অন্যান্য স্ক্রিপ্টগুলিতে সংহত করতে পারি এবং সরাসরি কাজের ওয়ার্কফ্লোতে ঢোকানোর মাধ্যমে জেনারেট করা চিত্রগুলির সুবিধা নিতে পারি, যা একটি অত্যন্ত গুরুত্বপূর্ণ বিষয়।

অফিসিয়াল কোলাব ডিফিউজার

আমি উপরে যে Colab সাজেস্ট করেছি তার সাথে এটি অনেকটা একই রকম, এটি প্রায় একই রকম চলে, আপনাকে মডেলটি আপলোড করতে হবে না, কিন্তু এতে গ্রাফিকাল ইন্টারফেস নেই এবং যেকোনো বিকল্প পরিবর্তন করতে হলে আপনাকে কোডের বিকল্প পরিবর্তন করতে হবে ব্লক করুন এবং আমাদের যা প্রয়োজন তার সাথে সামঞ্জস্য করতে তাদের পরিবর্তন করুন।

এছাড়াও, আমরা ইমেজ টু ইমেজ বিকল্পটি ব্যবহার করতে পারি না, যা খুবই আকর্ষণীয়।

আপনি এই থেকে অ্যাক্সেস করতে পারেন https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb

আমাদের কাছে প্রাপ্তবয়স্কদের চিত্রগুলির জন্য একটি ফিল্টার রয়েছে, বিখ্যাত NSFW, কিন্তু আপনি এই কোডটি ব্যবহার করে এটি নিষ্ক্রিয় করতে পারেন, অর্থাৎ, নথিতে একটি ঘর তৈরি করে

def dummy_checker(images, **kwargs): return images, False
http://pipe.safety_checker = dummy_checker

সেলের ঠিক পরেই লাগাতে হবে

pipe = pipe.to("cuda")

এবং এটি চালান

Colab স্টেবল ডিফিউশন ইনফিনিটি

এই Colab-এ আমরা Infinity টুল ব্যবহার করতে পারি, যা আমাদের ছবি সম্পূর্ণ করতে দেয়। বিদ্যমান চিত্র থেকে সামগ্রী তৈরি করুন। একটি বাস্তব পাস.

https://colab.research.google.com/github/lkwq007/stablediffusion-infinity/blob/master/stablediffusion_infinity_colab.ipynb#scrollTo=lVLSD0Dh0i-L

স্থিতিশীল বিস্তার সহ Dreambot

এটি স্থিতিশীল বিস্তারের সাথে Google এর ড্রিমবোথের বাস্তবায়ন যা একজন ব্যক্তির কয়েকটি ছবি থেকে, ডেমোর মুখের সাথে ব্যক্তিগতকৃত ফলাফল পেতে দেয়।

ছবি কাস্টমাইজ করার একটি আশ্চর্যজনক উপায়

https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

অন্যান্য কোলাব

আপনি ইতিমধ্যেই জানেন কিভাবে Colab-এ কাজ করতে হয়, ঠিক আছে আমি আপনাকে অন্যদের ছেড়ে দেব যা আমি খুঁজে পাচ্ছি যাতে আপনি আপনার সবচেয়ে পছন্দের একটি ব্যবহার করতে পারেন। এমনকি যদি আপনি চান তবে আপনি একটি অনুলিপি তৈরি করতে পারেন এবং আপনার নিজস্ব সংস্করণ পেতে আপনার পছন্দ অনুযায়ী এটি পরিবর্তন করতে পারেন

এর অফিসিয়াল ওয়েবসাইট থেকে

এটি ব্যবহার করার একটি সহজ উপায়, যেমন আপনি OpenAI তে Dall-e 2 ব্যবহার করেন, কিন্তু আপনি যদি প্ল্যাটফর্ম ব্যবহার করেন তবে পরিষেবাটি অর্থপ্রদান করা হয়। https://stability.ai/

HuggingFace থেকে

এটিকে দ্রুত পরীক্ষা করার এবং কিছু ছবি তোলার জন্য একটি আকর্ষণীয় বিকল্প, এটি কীভাবে কাজ করে তা দেখার জন্য, তবে অনেকগুলি বিকল্প রয়েছে যা আমরা ব্যবহার করব যদি আমরা এই বিষয়ে গুরুতর হতে যাচ্ছি।

https://huggingface.co/spaces/stabilityai/stable-diffusion

AWS বা কিছু ক্লাউড পরিষেবা ব্যবহার করে

স্ট্যাবল ডিফিউশন মডেলটি ক্লাউডে হার্ডওয়্যারে চালানোর মাধ্যমে ব্যবহার করা যেতে পারে, একটি ক্লাসিক পরিষেবা হল অ্যামাজনের AWS। এই মুহূর্তে আমি বিভিন্ন অ্যালগরিদমের সাথে কাজ করার জন্য EC2 দৃষ্টান্তগুলির সাথে পরীক্ষা করছি। আমি আপনাকে বলব এটা কেমন।

অন্যান্য পেমেন্ট পরিষেবা

স্টক ফটোতে বাস্তবায়ন থেকে শুরু করে ওয়েবসাইটগুলি যা আমাদের API-এর সাথে একীভূত করার অনুমতি দেয় এমন অনেকগুলি এবং আরও অনেক কিছু উদ্ভূত হচ্ছে৷ এই মুহুর্তে এটি আমার দৃষ্টি আকর্ষণ করেছে, যদিও ব্যক্তিগতভাবে আমি বিনামূল্যে পরিষেবাগুলি ব্যবহার করতে যাচ্ছি৷

প্রম্পট ইঞ্জিনিয়ারিংয়ের জন্য সরঞ্জাম

ইঞ্জিনিয়ারিং প্রম্পট হল সেই অংশ যা প্রম্পটের জেনারেশনকে বোঝায়, অর্থাৎ যে বাক্যাংশ দিয়ে আমরা মডেলকে ফিড করি যাতে এটি আমাদের ইমেজ তৈরি করে। এটি একটি তুচ্ছ সমস্যা নয় এবং দুর্দান্ত ফলাফল পেতে এটিকে কীভাবে ব্যবহার করতে হয় তা আপনাকে খুব ভালভাবে জানতে হবে।

শেখার জন্য একটি খুব দরকারী টুল অভিধান, যেখানে আমরা চিত্র এবং তারা যে প্রম্পট ব্যবহার করেছে, বীজ এবং নির্দেশিকা স্কেল দেখতে পাই।

আপনার চারপাশে ব্রাউজিং শিখতে হবে যে আপনি যে ধরনের ফলাফল খুঁজছেন তা পেতে আপনাকে প্রম্পটে কি ধরনের উপাদান বরাদ্দ করতে হবে।

Deja উন মন্তব্য