Gemini API обеспечивает доступ к Imagen 3 , модели Google для преобразования текста в изображение высочайшего качества, обладающей рядом новых и улучшенных возможностей. Imagen 3 может делать следующее:
- Создавайте изображения с большей детализацией, более насыщенным освещением и меньшим количеством отвлекающих артефактов, чем предыдущие модели.
- Понимать подсказки, написанные на естественном языке
- Создавайте изображения в широком диапазоне форматов и стилей.
- Рендеринг текста более эффективно, чем в предыдущих моделях
Создание изображений
В этом разделе показано, как создать экземпляр модели Imagen и генерировать изображения.
После установки генеративного AI SDK Google вы можете использовать следующий код для создания изображений:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Fuzzy bunnies in my kitchen',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
Пример кода должен вывести четыре изображения, подобных этому:
Разработчики Python также могут опробовать записную книжку «Начало работы с Imagen» в « Поваренной книге Gemini» .
Параметры модели изображения
Для generate_images()
доступны следующие параметры:
-
prompt
: текстовая подсказка для изображения. -
number_of_images
: количество генерируемых изображений от 1 до 4 (включительно). По умолчанию — 4. -
aspect_ratio
: изменяет соотношение сторон сгенерированного изображения. Поддерживаемые значения:"1:1"
,"3:4"
,"4:3"
,"9:16"
и"16:9"
. По умолчанию установлено"1:1"
. -
safety_filter_level
: добавляет уровень фильтра к безопасности. Допустимы следующие значения:-
"BLOCK_LOW_AND_ABOVE"
: Блокировать, когда оценка вероятности или степень серьезностиLOW
,MEDIUM
илиHIGH
. -
"BLOCK_MEDIUM_AND_ABOVE"
: блокировать, когда оценка вероятности или степень серьезности равнаMEDIUM
илиHIGH
. -
"BLOCK_ONLY_HIGH"
: Блокировать, когда показатель вероятности или уровень серьезностиHIGH
.
-
-
person_generation
: разрешить модели генерировать изображения людей. Поддерживаются следующие значения:-
"DONT_ALLOW"
: блокировать создание изображений людей. -
"ALLOW_ADULT"
: создавать изображения взрослых, но не детей. Это значение по умолчанию.
-
К созданным изображениям всегда добавляется невидимый цифровой водяной знак SynthID .
Язык текстовых подсказок
Поддерживаются следующие языки ввода текстовых подсказок:
- английский (
en
)
Что дальше
Дополнительные сведения о написании приглашений для Imagen см. в руководстве по приглашениям Imagen .