Изображение 3 в API Gemini

Gemini API обеспечивает доступ к Imagen 3 , модели Google для преобразования текста в изображение высочайшего качества, обладающей рядом новых и улучшенных возможностей. Imagen 3 может делать следующее:

  • Создавайте изображения с большей детализацией, более насыщенным освещением и меньшим количеством отвлекающих артефактов, чем предыдущие модели.
  • Понимать подсказки, написанные на естественном языке
  • Создавайте изображения в широком диапазоне форматов и стилей.
  • Рендеринг текста более эффективно, чем в предыдущих моделях

Создание изображений

В этом разделе показано, как создать экземпляр модели Imagen и генерировать изображения.

После установки генеративного AI SDK Google вы можете использовать следующий код для создания изображений:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Fuzzy bunnies in my kitchen',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

Пример кода должен вывести четыре изображения, подобных этому:

Сгенерированное ИИ изображение двух пушистых кроликов на кухне

Разработчики Python также могут опробовать записную книжку «Начало работы с Imagen» в « Поваренной книге Gemini» .

Параметры модели изображения

Для generate_images() доступны следующие параметры:

  • prompt : текстовая подсказка для изображения.
  • number_of_images : количество генерируемых изображений от 1 до 4 (включительно). По умолчанию — 4.
  • aspect_ratio : изменяет соотношение сторон сгенерированного изображения. Поддерживаемые значения: "1:1" , "3:4" , "4:3" , "9:16" и "16:9" . По умолчанию установлено "1:1" .
  • safety_filter_level : добавляет уровень фильтра к безопасности. Допустимы следующие значения:
    • "BLOCK_LOW_AND_ABOVE" : Блокировать, когда оценка вероятности или степень серьезности LOW , MEDIUM или HIGH .
    • "BLOCK_MEDIUM_AND_ABOVE" : блокировать, когда оценка вероятности или степень серьезности равна MEDIUM или HIGH .
    • "BLOCK_ONLY_HIGH" : Блокировать, когда показатель вероятности или уровень серьезности HIGH .
  • person_generation : разрешить модели генерировать изображения людей. Поддерживаются следующие значения:
    • "DONT_ALLOW" : блокировать создание изображений людей.
    • "ALLOW_ADULT" : создавать изображения взрослых, но не детей. Это значение по умолчанию.

К созданным изображениям всегда добавляется невидимый цифровой водяной знак SynthID .

Язык текстовых подсказок

Поддерживаются следующие языки ввода текстовых подсказок:

  • английский ( en )

Что дальше

Дополнительные сведения о написании приглашений для Imagen см. в руководстве по приглашениям Imagen .