Ta strona zawiera informacje o aktualizacjach interfejsu Gemini API.
5 czerwca 2025 r.
- Opublikowaliśmy
gemini-2.5-pro-preview-06-05
, nową wersję naszego najmocniejszego modelu, która teraz obsługuje myślenie adaptacyjne. Więcej informacji znajdziesz w artykułach Gemini 2.5 Pro – podgląd i Myślenie.gemini-2.5-pro-preview-05-06
automatycznie będzie wskazywać nową wersję modelu.
20 maja 2025 r.
Aktualizacje interfejsu API:
- Wprowadzono obsługę własnego przetwarzania wideo za pomocą interwałów przycinania i konfigurowalnego próbkowania liczby klatek.
- Wprowadziliśmy możliwość korzystania z wielu narzędzi, które umożliwiają konfigurowanie wykonania kodu i uzyskiwanie informacji w wyszukiwarce Google w ramach tego samego żądania
generateContent
. - Wprowadziliśmy obsługę asyncjonalnych wywołań funkcji w interfejsie Live API.
- Wprowadziliśmy eksperymentalne narzędzie do wyświetlania kontekstu adresu URL, które zawiera adresy URL jako dodatkowy kontekst dla promptów.
Aktualizacje modelu:
- Udostępniono
gemini-2.5-flash-preview-05-20
, model Gemini w wersji beta zoptymalizowany pod kątem stosunku ceny do jakości i adaptacyjnego myślenia. Więcej informacji znajdziesz w artykułach Gemini 2.5 Flash Preview i Thinking. - Opublikowaliśmy modele
gemini-2.5-pro-preview-tts
igemini-2.5-flash-preview-tts
, które mogą generować mowę za pomocą 1 lub 2 głośników. - Opublikowano model
lyria-realtime-exp
, który generuje muzykę w czasie rzeczywistym. - Opublikowano modele
gemini-2.5-flash-preview-native-audio-dialog
igemini-2.5-flash-exp-native-audio-thinking-dialog
, czyli nowe modele Gemini dla interfejsu Live API z natywnymi funkcjami wyjścia audio. Więcej informacji znajdziesz w przewodniku po interfejsie Live API i Gemini 2.5 Flash Native Audio. - Opublikowana wersja
gemma-3n-e4b-it
w wersji podglądowej, dostępna w AI Studio i za pomocą interfejsu Gemini API w ramach premiery Gemma 3n.
7 maja 2025 r.
- Udostępniono
gemini-2.0-flash-preview-image-generation
, model podglądu do generowania i edytowania obrazów. Więcej informacji znajdziesz w artykułach Generowanie obrazów i Generowanie obrazów do podglądu w Gemini 2.0 z modelem Flash.
6 maja 2025 r.
- Opublikowaliśmy
gemini-2.5-pro-preview-05-06
, nową wersję naszego najmocniejszego modelu, która zawiera ulepszenia dotyczące kodu i wywołania funkcji.gemini-2.5-pro-preview-03-25
automatycznie odwołuje się do nowej wersji modelu.
17 kwietnia 2025 r.
- Udostępniono
gemini-2.5-flash-preview-04-17
, model Gemini w wersji testowej zoptymalizowany pod kątem stosunku ceny do jakości i myślenia adaptacyjnego. Więcej informacji znajdziesz w artykułach Gemini 2.5 Flash Preview i Thinking.
16 kwietnia 2025 r.
- Wprowadziliśmy buforowanie kontekstu w Gemini 2.0 Flash.
9 kwietnia 2025 r.
Aktualizacje modelu:
- Opublikowany model
veo-2.0-generate-001
, ogólnie dostępny (GA), do konwertowania tekstu i obrazów na filmy, który potrafi generować szczegółowe i artystyczne filmy. Więcej informacji znajdziesz w dokumentacji Voo. Wprowadziliśmy
gemini-2.0-flash-live-001
, publiczną wersję wstępną modelu Live API z włączonym rozliczeniem.Ulepszone zarządzanie sesjami i ich niezawodność
- Wznowienie sesji: umożliwia utrzymanie sesji w przypadku tymczasowych zakłóceń w sieci. Interfejs API obsługuje teraz przechowywanie stanu sesji po stronie serwera (do 24 godzin) i zawiera uchwyty (session_resumption), które umożliwiają ponowne nawiązanie połączenia i wznowienie od miejsca, w którym zostało ono przerwane.
- Dłuższe sesje dzięki kompresji kontekstu: umożliwiają przedłużenie interakcji poza poprzednie limity czasowe. Skonfiguruj kompresję okna kontekstowego za pomocą mechanizmu okna przesuwającego, aby automatycznie zarządzać długością kontekstu i zapobiegać nagłemu zakończeniu działania z powodu ograniczeń kontekstu.
- Powiadomienie o łagodnym rozłączeniu: otrzymasz wiadomość
GoAway
serwera, która poinformuje Cię, że połączenie ma zostać zamknięte. Pozwoli Ci to na łagodne zakończenie połączenia przed jego przerwaniem.
Więcej kontroli nad dynamiką interakcji
Konfigurowalne wykrywanie aktywności głosowej (VAD): wybierz poziomy czułości lub całkowicie wyłącz automatyczne wykrywanie aktywności głosowej i użyj nowych zdarzeń klienta (
activityStart
,activityEnd
) do ręcznego sterowania zwrotami.Konfigurowalne obsługiwanie przerwania: określ, czy dane wejściowe użytkownika powinny przerywać odpowiedź modelu.
Konfigurowalna obsługa zwrotów: określ, czy interfejs API ma przetwarzać wszystkie dane audio i wideo w ciągu, czy tylko rejestrować je, gdy wykryto, że użytkownik mówi.
Konfigurowalna rozdzielczość multimediów: optymalizuj jakość lub wykorzystanie tokenów, wybierając rozdzielczość multimediów wejściowych.
Więcej funkcji i bogatsze wyniki
Rozszerzone opcje głosu i języka: możesz wybrać 2 nowe głosy i 30 nowych języków do wyjścia audio. Język wyjściowy można teraz skonfigurować w sekcji
speechConfig
.Przesyłanie strumieniowe tekstu: otrzymywanie odpowiedzi tekstowych stopniowo, w miarę ich generowania, co umożliwia szybsze wyświetlanie ich użytkownikowi.
Raportowanie wykorzystania tokenów: uzyskaj informacje o wykorzystaniu dzięki szczegółowym danym o liczbie tokenów w polu
usageMetadata
wiadomości serwera, podzielonych według trybu i faz promptu lub odpowiedzi.
4 kwietnia 2025 r.
- Opublikowano
gemini-2.5-pro-preview-03-25
, publiczną wersję testową Gemini 2.5 Pro z włączonym rozliczeniem. Nadal możesz korzystać zgemini-2.5-pro-exp-03-25
w wersji bezpłatnej.
25 marca 2025 r.
- Opublikowaliśmy eksperymentalny model Gemini
gemini-2.5-pro-exp-03-25
, który domyślnie ma włączony tryb myślenia. Więcej informacji znajdziesz w artykule Gemini 2.5 Pro Experimental.
12 marca 2025 r.
Aktualizacje modelu:
- Wprowadziliśmy eksperymentalny model Gemini 2.0 Flash, który umożliwia generowanie i edytowanie obrazów.
- Został wydany
gemma-3-27b-it
i jest dostępny w AI Studio oraz za pomocą interfejsu Gemini API w ramach Gemma 3.
Aktualizacje interfejsu API:
- Dodaliśmy obsługę adresów URL filmów w YouTube jako źródła multimediów.
- Dodaliśmy obsługę wstawionego filmu o rozmiarze poniżej 20 MB.
11 marca 2025 r.
Aktualizacje pakietu SDK:
- udostępniliśmy publicznie pakiet Google Gen AI SDK na potrzeby TypeScript i JavaScript.
7 marca 2025 r.
Aktualizacje modelu:
- Wprowadziliśmy
gemini-embedding-exp-03-07
, eksperymentalny model osadzania oparty na Gemini w publicznej wersji przedpremierowej.
28 lutego 2025 r.
Aktualizacje interfejsu API:
- Dodano obsługę wyszukiwania jako narzędzia w modelu
gemini-2.0-pro-exp-02-05
, który jest eksperymentalnym modelem opartym na Gemini 2.0 Pro.
25 lutego 2025 r.
Aktualizacje modelu:
- Opublikowano
gemini-2.0-flash-lite
, ogólnie dostępną wersję Gemini 2.0 Flash-Lite, która jest zoptymalizowana pod kątem szybkości, skalowalności i wydajności kosztowej.
19 lutego 2025 r.
Aktualizacje AI Studio:
- Obsługa dodatkowych regionów (Kosowo, Grenlandia i Wyspy Owcze).
Aktualizacje interfejsu API:
- Obsługa dodatkowych regionów (Kosowo, Grenlandia i Wyspy Owcze).
18 lutego 2025 r.
Aktualizacje modelu:
- Gemini 1.0 Pro nie jest już obsługiwana. Listę obsługiwanych modeli znajdziesz w artykule Modele Gemini.
11 lutego 2025 r.
Aktualizacje interfejsu API:
- Aktualizacje dotyczące zgodności z bibliotekami OpenAI.
6 lutego 2025 r.
Aktualizacje modelu:
- Wprowadziliśmy wersję
imagen-3.0-generate-002
, ogólnie dostępną (GA) obrazu 3 w interfejsie Gemini API.
Aktualizacje pakietu SDK:
- Udostępniliśmy publicznie wersję przedpremierową pakietu Google Gen AI SDK for Java.
5 lutego 2025 r.
Aktualizacje modelu:
- Opublikowano
gemini-2.0-flash-001
, ogólnodostępną wersję Gemini 2.0 Flash, która obsługuje dane wyjściowe tylko tekstowe. - Opublikowano
gemini-2.0-pro-exp-02-05
, eksperymentalną publiczną wersję podglądu Gemini 2.0 Pro. - Opublikowany
gemini-2.0-flash-lite-preview-02-05
, eksperymentalny publiczny model w wersji podglądowej zoptymalizowany pod kątem opłacalności.
Aktualizacje interfejsu API:
- Dodano obsługę wejścia pliku i wyjścia wykresu w wykonywaniu kodu.
Aktualizacje pakietu SDK:
- Opublikowaliśmy pakiet Google Gen AI SDK dla Pythona w ramach ogólnej dostępności.
21 stycznia 2025 r.
Aktualizacje modelu:
- Opublikowana
gemini-2.0-flash-thinking-exp-01-21
, najnowsza wersja podglądu modelu Gemini 2.0 Flash Thinking.
19 grudnia 2024 r.
Aktualizacje modelu:
Opublikowaliśmy publiczną wersję przedpremierową trybu Gemini 2.0 Flash Thinking. Tryb myślenia to model obliczeniowy na czas testowania, który pozwala zobaczyć proces myślenia modelu podczas generowania odpowiedzi. Model generuje odpowiedzi z lepszymi możliwościami rozumowania.
Więcej informacji o trybie Gemini 2.0 Flash Thinking znajdziesz na stronie z omówieniem.
11 grudnia 2024 r.
Aktualizacje modelu:
- Opublikowano Gemini 2.0 Flash Experimental w ramach publicznej wersji przedpremierowej. Gemini 2.0 Flash Experimental zawiera m.in. te funkcje:
- dwukrotnie szybszy niż Gemini 1.5 Pro;
- Transmisja dwukierunkowa za pomocą interfejsu Live API
- generowanie odpowiedzi multimodalnych w postaci tekstu, obrazów i mowy;
- korzystanie z wbudowanego narzędzia z wykorzystaniem wnioskowania wieloetapowego do korzystania z funkcji takich jak wykonywanie kodu, wyszukiwanie, wywoływanie funkcji itp.
Więcej informacji o Gemini 2.0 Flash znajdziesz na naszej stronie z omówieniem.
21 listopada 2024 r.
Aktualizacje modelu:
- Wydaliśmy
gemini-exp-1121
, jeszcze bardziej zaawansowany eksperymentalny model interfejsu Gemini API.
Aktualizacje modelu:
- Zaktualizowano aliasy modeli
gemini-1.5-flash-latest
igemini-1.5-flash
, aby używały modelugemini-1.5-flash-002
.- Zmień parametr
top_k
: modelgemini-1.5-flash-002
obsługuje wartościtop_k
z przedziału od 1 do 41 (bez 1 i 41). Wartości większe niż 40 zostaną zmienione na 40.
- Zmień parametr
14 listopada 2024 r.
Aktualizacje modelu:
- Opublikowano
gemini-exp-1114
, czyli zaawansowany eksperymentalny model interfejsu Gemini API.
8 listopada 2024 r.
Aktualizacje interfejsu API:
- Dodano obsługę Gemini w bibliotekach OpenAI / interfejsie API REST.
31 października 2024 r.
Aktualizacje interfejsu API:
3 października 2024 r.
Aktualizacje modelu:
- Opublikowaliśmy
gemini-1.5-flash-8b-001
, stabilną wersję najmniejszego modelu Gemini API.
24 września 2024 r.
Aktualizacje modelu:
- Opublikowaliśmy
gemini-1.5-pro-002
igemini-1.5-flash-002
, czyli 2 nowe stabilne wersje Gemini 1.5 Pro i 1.5 Flash, które są ogólnie dostępne. - Zaktualizowano kod modelu
gemini-1.5-pro-latest
, aby używał funkcjigemini-1.5-pro-002
, a kod modelugemini-1.5-flash-latest
, aby używał funkcjigemini-1.5-flash-002
. - Wersja
gemini-1.5-flash-8b-exp-0924
zastępuje wersjęgemini-1.5-flash-8b-exp-0827
. - Wprowadziliśmy filtr bezpieczeństwa dotyczący integralności obywatelskiej w Gemini API i AI Studio.
- Dodaliśmy obsługę 2 nowych parametrów w modelach Gemini 1.5 Pro i 1.5 Flash w Pythonie i NodeJS:
frequencyPenalty
ipresencePenalty
.
19 września 2024 r.
Aktualizacje AI Studio:
- Dodaliśmy przyciski „Lubię” i „Nie lubię” do odpowiedzi modelowanych, aby umożliwić użytkownikom wyrażanie opinii na temat jakości odpowiedzi.
Aktualizacje interfejsu API:
- Dodano obsługę środków Google Cloud, które można teraz wykorzystać na korzystanie z interfejsu Gemini API.
17 września 2024 r.
Aktualizacje AI Studio:
- Dodano przycisk Otwórz w Colab, który eksportuje prompt i kod potrzebny do jego uruchomienia do notatnika Colab. Ta funkcja nie obsługuje jeszcze promptów z narzędziami (tryb JSON, wywoływanie funkcji lub wykonywanie kodu).
13 września 2024 r.
Aktualizacje AI Studio:
- Dodano obsługę trybu porównywania, który umożliwia porównywanie odpowiedzi w różnych modelach i promptach, aby znaleźć rozwiązanie najlepiej dopasowane do Twojego przypadku użycia.
30 sierpnia 2024 r.
Aktualizacje modelu:
- Gemini 1.5 Flash obsługuje podawanie schematu JSON w ramach konfiguracji modelu.
27 sierpnia 2024 r.
Aktualizacje modelu:
- Opublikowaliśmy te modele eksperymentalne:
gemini-1.5-pro-exp-0827
gemini-1.5-flash-exp-0827
gemini-1.5-flash-8b-exp-0827
9 sierpnia 2024 r.
Aktualizacje interfejsu API:
- Dodaliśmy obsługę przetwarzania plików PDF.
5 sierpnia 2024 r.
Aktualizacje modelu:
- Dodano obsługę dokładnego dopasowania w przypadku Gemini 1.5 Flash.
1 sierpnia 2024 r.
Aktualizacje modelu:
- Wprowadziliśmy
gemini-1.5-pro-exp-0801
, nową wersję eksperymentalną Gemini 1.5 Pro.
12 lipca 2024 r.
Aktualizacje modelu:
- Usunięcie obsługi Gemini 1.0 Pro Vision z usług i narzędzi Google AI.
27 czerwca 2024 r.
Aktualizacje modelu:
- Opublikowanie Gemini 1.5 Pro z oknem kontekstu o wielkości 2 mln tokenów.
Aktualizacje interfejsu API:
- Dodaliśmy obsługę wykonywania kodu.
18 czerwca 2024 r.
Aktualizacje interfejsu API:
- Dodaliśmy obsługę buforowania kontekstu.
12 czerwca 2024 r.
Aktualizacje modelu:
- Gemini 1.0 Pro Vision zostało wycofane.
23 maja 2024 r.
Aktualizacje modelu:
- Gemini 1.5 Pro (
gemini-1.5-pro-001
) jest ogólnie dostępna (GA). - Gemini 1.5 Flash (
gemini-1.5-flash-001
) jest ogólnie dostępna (GA).
14 maja 2024 r.
Aktualizacje interfejsu API:
- Wprowadziliśmy okno kontekstu o 2 mln tokenów dla Gemini 1.5 Pro (lista oczekujących).
- Wprowadziliśmy rozliczenia według wykorzystania w przypadku Gemini 1.0 Pro. Wkrótce udostępnimy rozliczenia Gemini 1.5 Pro i Gemini 1.5 Flash.
- Wprowadziliśmy zwiększone limity szybkości dla nadchodzącej płatnej wersji Gemini 1.5 Pro.
- Dodano wbudowaną obsługę filmów w interfejsie File API.
- Dodano obsługę zwykłego tekstu w interfejsie File API.
- Dodano obsługę równoległego wywoływania funkcji, która zwraca więcej niż 1 wywołanie naraz.
10 maja 2024 r.
Aktualizacje modelu:
- Wersja
gemini-1.5-flash-latest
Gemini 1.5 Flash jest dostępna w wersji podglądowej.
9 kwietnia 2024 r.
Aktualizacje modelu:
- Wersja
gemini-1.5-pro-latest
Gemini 1.5 Pro została wydana w wersji wstępnej. - Wprowadziliśmy nowy model wektorów dystrybucyjnych tekstu,
text-embeddings-004
, który obsługuje rozmiary elastycznego wektora dystrybucyjnego poniżej 768.
Aktualizacje interfejsu API:
- Udostępniliśmy interfejs File API do tymczasowego przechowywania plików multimedialnych na potrzeby promptów.
- Dodaliśmy obsługę promptów z tekstem, obrazem i danymi audio, czyli promptów multimodalnych. Więcej informacji znajdziesz w artykule Promowanie za pomocą multimediów.
- Wprowadziliśmy instrukcje systemowe w wersji beta.
- Dodano tryb wywoływania funkcji, który określa sposób wykonywania wywołania funkcji.
- Dodano obsługę opcji konfiguracji
response_mime_type
, która umożliwia żądanie odpowiedzi w formacie JSON.
19 marca 2024 r.
Aktualizacje modelu:
- Dodano obsługę dostrajania Gemini 1.0 Pro w Google AI Studio lub za pomocą interfejsu Gemini API.
13 grudnia 2023 r.
Aktualizacje modelu:
- gemini-pro: nowy model tekstowy do wykonywania wielu różnych zadań. równowaga między możliwościami a wydajnością,
- gemini-pro-vision: nowy multimodalny model do wykonywania różnorodnych zadań. Równoważy możliwości i wydajność.
- embedding-001: nowy model wektorów dystrybucyjnych.
- aqa: nowy model specjalnie dostosowany do odpowiadania na pytania za pomocą fragmentów tekstu służących do tworzenia odpowiedzi.
Więcej informacji znajdziesz w artykule Modele Gemini.
Aktualizacje wersji interfejsu API:
- v1: stabilny kanał interfejsu API.
- v1beta: wersja beta. Ten kanał ma funkcje, które mogą być w trakcie tworzenia.
Więcej informacji znajdziesz w temacie wersji interfejsu API.
Aktualizacje interfejsu API:
GenerateContent
to jeden zintegrowany punkt końcowy do obsługi czatu i tekstu.- Streaming dostępny za pomocą metody
StreamGenerateContent
. - Możliwości multimodalne: obraz jest nową obsługiwaną modalnością
- Nowe funkcje w wersji beta:
- Wywoływanie funkcji
- Semantic Retriever
- Odpowiadanie na pytania z przypisanym autorem (AQA)
- Zaktualizowana liczba kandydatów: modele Gemini zwracają tylko 1 kandydata.
- różne kategorie ustawień bezpieczeństwa i SafetyRating. Więcej informacji znajdziesz w ustawieniach zabezpieczeń.
- Dostrajanie modeli nie jest jeszcze obsługiwane w przypadku modeli Gemini (praca w toku).