Gemini API-এ চিত্র 3

Gemini API, Google-এর সর্বোচ্চ মানের টেক্সট-টু-ইমেজ মডেল, Imagen 3 -তে অ্যাক্সেস প্রদান করে, যেখানে বেশ কিছু নতুন এবং উন্নত ক্ষমতা রয়েছে। চিত্র 3 নিম্নলিখিত কাজ করতে পারে:

  • পূর্ববর্তী মডেলগুলির তুলনায় আরও ভাল বিশদ, সমৃদ্ধ আলো এবং কম বিভ্রান্তিকর শিল্পকর্ম সহ চিত্রগুলি তৈরি করুন
  • স্বাভাবিক ভাষায় লেখা প্রম্পটগুলি বুঝুন
  • বিস্তৃত বিন্যাস এবং শৈলীতে ছবি তৈরি করুন
  • পূর্ববর্তী মডেলের তুলনায় আরো কার্যকরভাবে পাঠ্য রেন্ডার করুন

ছবি তৈরি করুন

এই বিভাগটি আপনাকে দেখায় কিভাবে একটি ইমেজেন মডেল ইনস্ট্যান্ট করতে হয় এবং ছবি তৈরি করতে হয়।

আপনি Google generative AI SDK ইনস্টল করার পরে, আপনি চিত্র তৈরি করতে নিম্নলিখিত কোড ব্যবহার করতে পারেন:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Fuzzy bunnies in my kitchen',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

কোড নমুনাটি এইটির মতো চারটি চিত্র আউটপুট করা উচিত:

রান্নাঘরে দুটি অস্পষ্ট খরগোশের AI-উত্পন্ন চিত্র

পাইথন ডেভেলপাররাও জেমিনি কুকবুকে ইমেজেন নোটবুক দিয়ে শুরু করার চেষ্টা করতে পারেন।

ইমেজ মডেল পরামিতি

নিম্নলিখিত পরামিতি generate_images() এর জন্য উপলব্ধ:

  • prompt : ছবির জন্য টেক্সট প্রম্পট।
  • number_of_images : 1 থেকে 4 পর্যন্ত (অন্তর্ভুক্ত) তৈরি করা ছবির সংখ্যা। ডিফল্ট হল 4।
  • aspect_ratio : উত্পন্ন চিত্রের অনুপাত পরিবর্তন করে। সমর্থিত মানগুলি হল "1:1" , "3:4" , "4:3" , "9:16" , এবং "16:9" ডিফল্ট হল "1:1"
  • safety_filter_level : নিরাপত্তা ফিল্টারিং এ একটি ফিল্টার স্তর যোগ করে। নিম্নলিখিত মানগুলি বৈধ:
    • "BLOCK_LOW_AND_ABOVE" : যখন সম্ভাব্যতা স্কোর বা তীব্রতার স্কোর LOW , MEDIUM বা HIGH হয় তখন ব্লক করুন।
    • "BLOCK_MEDIUM_AND_ABOVE" : যখন সম্ভাব্যতা স্কোর বা তীব্রতার স্কোর MEDIUM বা HIGH হয় তখন ব্লক করুন।
    • "BLOCK_ONLY_HIGH" : সম্ভাব্যতা স্কোর বা তীব্রতার স্কোর HIGH হলে ব্লক করুন।
  • person_generation : মডেলটিকে মানুষের ছবি তৈরি করার অনুমতি দিন। নিম্নলিখিত মানগুলি সমর্থিত:
    • "DONT_ALLOW" : মানুষের ছবি তৈরি করা ব্লক করুন।
    • "ALLOW_ADULT" : প্রাপ্তবয়স্কদের ছবি তৈরি করুন, কিন্তু শিশুদের নয়৷ এটি ডিফল্ট।

একটি অদৃশ্যমান ডিজিটাল SynthID ওয়াটারমার্ক সবসময় জেনারেট করা ছবিতে যোগ করা হয়।

টেক্সট প্রম্পট ভাষা

নিম্নলিখিত ইনপুট পাঠ্য প্রম্পট ভাষা সমর্থিত:

  • ইংরেজি ( en )

এরপর কি

ইমেজেনের জন্য প্রম্পট লেখা সম্পর্কে আরও জানতে, ইমেজেন প্রম্পট গাইডটি দেখুন।