Gemini API menyediakan akses ke Imagen 3, model teks ke gambar berkualitas tertinggi dari Google, yang menampilkan sejumlah kemampuan baru yang ditingkatkan. Imagen 3 dapat melakukan hal berikut:
- Membuat gambar dengan detail yang lebih baik, pencahayaan yang lebih kaya, dan lebih sedikit artefak yang mengganggu dibandingkan model sebelumnya
- Memahami perintah yang ditulis dalam bahasa alami
- Buat gambar dalam berbagai format dan gaya
- Merender teks secara lebih efektif daripada model sebelumnya
Buat gambar
Bagian ini menunjukkan cara membuat instance model Imagen dan menghasilkan gambar.
Setelah menginstal Google AI Generatif AI SDK, Anda dapat menggunakan kode berikut untuk membuat gambar:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Fuzzy bunnies in my kitchen',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
Contoh kode akan menghasilkan empat gambar yang mirip dengan gambar ini:
Developer Python juga dapat mencoba notebook Memulai dengan Imagen di Gemini Cookbook.
Parameter model Imagen
Parameter berikut tersedia untuk generate_images()
:
prompt
: Perintah teks untuk gambar.number_of_images
: Jumlah gambar yang akan dihasilkan, dari 1 hingga 4 (inklusif). Defaultnya adalah 4.aspect_ratio
: Mengubah rasio aspek gambar yang dihasilkan. Nilai yang didukung adalah"1:1"
,"3:4"
,"4:3"
,"9:16"
, dan"16:9"
. Defaultnya adalah"1:1"
.safety_filter_level
: Menambahkan tingkat filter ke pemfilteran keamanan. Nilai berikut valid:"BLOCK_LOW_AND_ABOVE"
: Blokir jika skor probabilitas atau skor keparahannya adalahLOW
,MEDIUM
, atauHIGH
."BLOCK_MEDIUM_AND_ABOVE"
: Blokir jika skor probabilitas atau skor keparahannya adalahMEDIUM
atauHIGH
."BLOCK_ONLY_HIGH"
: Blokir jika skor probabilitas atau skor keparahannya adalahHIGH
.
person_generation
: Mengizinkan model membuat gambar orang. Nilai berikut didukung:"DONT_ALLOW"
: Memblokir pembuatan gambar orang."ALLOW_ADULT"
: Membuat gambar orang dewasa, tetapi tidak untuk anak-anak. Ini adalah defaultnya.
Watermark SynthID digital yang tidak terlihat selalu ditambahkan ke gambar yang dihasilkan.
Bahasa perintah teks
Bahasa perintah teks input berikut didukung:
- Inggris (
en
)
Langkah berikutnya
Untuk mempelajari lebih lanjut penulisan perintah untuk Imagen, lihat Panduan perintah Imagen.