Ta strona została przetłumaczona przez Cloud Translation API.

Informacje o wersjach

Ta strona zawiera informacje o aktualizacjach interfejsu Gemini API.

5 czerwca 2025 r.

Opublikowaliśmy gemini-2.5-pro-preview-06-05, nową wersję naszego najmocniejszego modelu, która teraz obsługuje myślenie adaptacyjne. Więcej informacji znajdziesz w artykułach Gemini 2.5 Pro – podgląd i Myślenie. gemini-2.5-pro-preview-05-06 automatycznie będzie wskazywać nową wersję modelu.

20 maja 2025 r.

Aktualizacje interfejsu API:

Wprowadzono obsługę własnego przetwarzania wideo za pomocą interwałów przycinania i konfigurowalnego próbkowania liczby klatek.
Wprowadziliśmy możliwość korzystania z wielu narzędzi, które umożliwiają konfigurowanie wykonania kodu i uzyskiwanie informacji w wyszukiwarce Google w ramach tego samego żądania generateContent.
Wprowadziliśmy obsługę asyncjonalnych wywołań funkcji w interfejsie Live API.
Wprowadziliśmy eksperymentalne narzędzie do wyświetlania kontekstu adresu URL, które zawiera adresy URL jako dodatkowy kontekst dla promptów.

Aktualizacje modelu:

Udostępniono gemini-2.5-flash-preview-05-20, model Gemini w wersji beta zoptymalizowany pod kątem stosunku ceny do jakości i adaptacyjnego myślenia. Więcej informacji znajdziesz w artykułach Gemini 2.5 Flash Preview i Thinking.
Opublikowaliśmy modele gemini-2.5-pro-preview-tts i gemini-2.5-flash-preview-tts, które mogą generować mowę za pomocą 1 lub 2 głośników.
Opublikowano model lyria-realtime-exp, który generuje muzykę w czasie rzeczywistym.
Opublikowano modele gemini-2.5-flash-preview-native-audio-dialog i gemini-2.5-flash-exp-native-audio-thinking-dialog, czyli nowe modele Gemini dla interfejsu Live API z natywnymi funkcjami wyjścia audio. Więcej informacji znajdziesz w przewodniku po interfejsie Live API i Gemini 2.5 Flash Native Audio.
Opublikowana wersja gemma-3n-e4b-it w wersji podglądowej, dostępna w AI Studio i za pomocą interfejsu Gemini API w ramach premiery Gemma 3n.

7 maja 2025 r.

Udostępniono gemini-2.0-flash-preview-image-generation, model podglądu do generowania i edytowania obrazów. Więcej informacji znajdziesz w artykułach Generowanie obrazów i Generowanie obrazów do podglądu w Gemini 2.0 z modelem Flash.

6 maja 2025 r.

Opublikowaliśmy gemini-2.5-pro-preview-05-06, nową wersję naszego najmocniejszego modelu, która zawiera ulepszenia dotyczące kodu i wywołania funkcji. gemini-2.5-pro-preview-03-25automatycznie odwołuje się do nowej wersji modelu.

17 kwietnia 2025 r.

Udostępniono gemini-2.5-flash-preview-04-17, model Gemini w wersji testowej zoptymalizowany pod kątem stosunku ceny do jakości i myślenia adaptacyjnego. Więcej informacji znajdziesz w artykułach Gemini 2.5 Flash Preview i Thinking.

16 kwietnia 2025 r.

Wprowadziliśmy buforowanie kontekstu w Gemini 2.0 Flash.

9 kwietnia 2025 r.

Aktualizacje modelu:

Opublikowany model veo-2.0-generate-001, ogólnie dostępny (GA), do konwertowania tekstu i obrazów na filmy, który potrafi generować szczegółowe i artystyczne filmy. Więcej informacji znajdziesz w dokumentacji Voo.
Wprowadziliśmy gemini-2.0-flash-live-001, publiczną wersję wstępną modelu Live API z włączonym rozliczeniem.
- Ulepszone zarządzanie sesjami i ich niezawodność
  - Wznowienie sesji: umożliwia utrzymanie sesji w przypadku tymczasowych zakłóceń w sieci. Interfejs API obsługuje teraz przechowywanie stanu sesji po stronie serwera (do 24 godzin) i zawiera uchwyty (session_resumption), które umożliwiają ponowne nawiązanie połączenia i wznowienie od miejsca, w którym zostało ono przerwane.
  - Dłuższe sesje dzięki kompresji kontekstu: umożliwiają przedłużenie interakcji poza poprzednie limity czasowe. Skonfiguruj kompresję okna kontekstowego za pomocą mechanizmu okna przesuwającego, aby automatycznie zarządzać długością kontekstu i zapobiegać nagłemu zakończeniu działania z powodu ograniczeń kontekstu.
  - Powiadomienie o łagodnym rozłączeniu: otrzymasz wiadomość GoAway serwera, która poinformuje Cię, że połączenie ma zostać zamknięte. Pozwoli Ci to na łagodne zakończenie połączenia przed jego przerwaniem.
- Więcej kontroli nad dynamiką interakcji
- Konfigurowalne wykrywanie aktywności głosowej (VAD): wybierz poziomy czułości lub całkowicie wyłącz automatyczne wykrywanie aktywności głosowej i użyj nowych zdarzeń klienta (activityStart, activityEnd) do ręcznego sterowania zwrotami.
- Konfigurowalne obsługiwanie przerwania: określ, czy dane wejściowe użytkownika powinny przerywać odpowiedź modelu.
- Konfigurowalna obsługa zwrotów: określ, czy interfejs API ma przetwarzać wszystkie dane audio i wideo w ciągu, czy tylko rejestrować je, gdy wykryto, że użytkownik mówi.
- Konfigurowalna rozdzielczość multimediów: optymalizuj jakość lub wykorzystanie tokenów, wybierając rozdzielczość multimediów wejściowych.
- Więcej funkcji i bogatsze wyniki
- Rozszerzone opcje głosu i języka: możesz wybrać 2 nowe głosy i 30 nowych języków do wyjścia audio. Język wyjściowy można teraz skonfigurować w sekcji speechConfig.
- Przesyłanie strumieniowe tekstu: otrzymywanie odpowiedzi tekstowych stopniowo, w miarę ich generowania, co umożliwia szybsze wyświetlanie ich użytkownikowi.
- Raportowanie wykorzystania tokenów: uzyskaj informacje o wykorzystaniu dzięki szczegółowym danym o liczbie tokenów w polu usageMetadata wiadomości serwera, podzielonych według trybu i faz promptu lub odpowiedzi.

4 kwietnia 2025 r.

Opublikowano gemini-2.5-pro-preview-03-25, publiczną wersję testową Gemini 2.5 Pro z włączonym rozliczeniem. Nadal możesz korzystać z gemini-2.5-pro-exp-03-25 w wersji bezpłatnej.

25 marca 2025 r.

Opublikowaliśmy eksperymentalny model Gemini gemini-2.5-pro-exp-03-25, który domyślnie ma włączony tryb myślenia. Więcej informacji znajdziesz w artykule Gemini 2.5 Pro Experimental.

12 marca 2025 r.

Aktualizacje modelu:

Wprowadziliśmy eksperymentalny model Gemini 2.0 Flash, który umożliwia generowanie i edytowanie obrazów.
Został wydany gemma-3-27b-it i jest dostępny w AI Studio oraz za pomocą interfejsu Gemini API w ramach Gemma 3.

Aktualizacje interfejsu API:

Dodaliśmy obsługę adresów URL filmów w YouTube jako źródła multimediów.
Dodaliśmy obsługę wstawionego filmu o rozmiarze poniżej 20 MB.

11 marca 2025 r.

Aktualizacje pakietu SDK:

udostępniliśmy publicznie pakiet Google Gen AI SDK na potrzeby TypeScript i JavaScript.

7 marca 2025 r.

Aktualizacje modelu:

Wprowadziliśmy gemini-embedding-exp-03-07, eksperymentalny model osadzania oparty na Gemini w publicznej wersji przedpremierowej.

28 lutego 2025 r.

Aktualizacje interfejsu API:

Dodano obsługę wyszukiwania jako narzędzia w modelu gemini-2.0-pro-exp-02-05, który jest eksperymentalnym modelem opartym na Gemini 2.0 Pro.

25 lutego 2025 r.

Aktualizacje modelu:

Opublikowano gemini-2.0-flash-lite, ogólnie dostępną wersję Gemini 2.0 Flash-Lite, która jest zoptymalizowana pod kątem szybkości, skalowalności i wydajności kosztowej.

19 lutego 2025 r.

Aktualizacje AI Studio:

Obsługa dodatkowych regionów (Kosowo, Grenlandia i Wyspy Owcze).

Aktualizacje interfejsu API:

Obsługa dodatkowych regionów (Kosowo, Grenlandia i Wyspy Owcze).

18 lutego 2025 r.

Aktualizacje modelu:

Gemini 1.0 Pro nie jest już obsługiwana. Listę obsługiwanych modeli znajdziesz w artykule Modele Gemini.

11 lutego 2025 r.

Aktualizacje interfejsu API:

Aktualizacje dotyczące zgodności z bibliotekami OpenAI.

6 lutego 2025 r.

Aktualizacje modelu:

Wprowadziliśmy wersję imagen-3.0-generate-002, ogólnie dostępną (GA) obrazu 3 w interfejsie Gemini API.

Aktualizacje pakietu SDK:

Udostępniliśmy publicznie wersję przedpremierową pakietu Google Gen AI SDK for Java.

5 lutego 2025 r.

Aktualizacje modelu:

Opublikowano gemini-2.0-flash-001, ogólnodostępną wersję Gemini 2.0 Flash, która obsługuje dane wyjściowe tylko tekstowe.
Opublikowano gemini-2.0-pro-exp-02-05, eksperymentalną publiczną wersję podglądu Gemini 2.0 Pro.
Opublikowany gemini-2.0-flash-lite-preview-02-05, eksperymentalny publiczny model w wersji podglądowej zoptymalizowany pod kątem opłacalności.

Aktualizacje interfejsu API:

Dodano obsługę wejścia pliku i wyjścia wykresu w wykonywaniu kodu.

Aktualizacje pakietu SDK:

Opublikowaliśmy pakiet Google Gen AI SDK dla Pythona w ramach ogólnej dostępności.

21 stycznia 2025 r.

Aktualizacje modelu:

Opublikowana gemini-2.0-flash-thinking-exp-01-21, najnowsza wersja podglądu modelu Gemini 2.0 Flash Thinking.

19 grudnia 2024 r.

Aktualizacje modelu:

Opublikowaliśmy publiczną wersję przedpremierową trybu Gemini 2.0 Flash Thinking. Tryb myślenia to model obliczeniowy na czas testowania, który pozwala zobaczyć proces myślenia modelu podczas generowania odpowiedzi. Model generuje odpowiedzi z lepszymi możliwościami rozumowania.

Więcej informacji o trybie Gemini 2.0 Flash Thinking znajdziesz na stronie z omówieniem.

11 grudnia 2024 r.

Aktualizacje modelu:

Opublikowano Gemini 2.0 Flash Experimental w ramach publicznej wersji przedpremierowej. Gemini 2.0 Flash Experimental zawiera m.in. te funkcje:
- dwukrotnie szybszy niż Gemini 1.5 Pro;
- Transmisja dwukierunkowa za pomocą interfejsu Live API
- generowanie odpowiedzi multimodalnych w postaci tekstu, obrazów i mowy;
- korzystanie z wbudowanego narzędzia z wykorzystaniem wnioskowania wieloetapowego do korzystania z funkcji takich jak wykonywanie kodu, wyszukiwanie, wywoływanie funkcji itp.

Więcej informacji o Gemini 2.0 Flash znajdziesz na naszej stronie z omówieniem.

21 listopada 2024 r.

Aktualizacje modelu:

Wydaliśmy gemini-exp-1121, jeszcze bardziej zaawansowany eksperymentalny model interfejsu Gemini API.

Aktualizacje modelu:

Zaktualizowano aliasy modeli gemini-1.5-flash-latest i gemini-1.5-flash, aby używały modelu gemini-1.5-flash-002.
- Zmień parametr top_k: model gemini-1.5-flash-002 obsługuje wartości top_k z przedziału od 1 do 41 (bez 1 i 41). Wartości większe niż 40 zostaną zmienione na 40.

14 listopada 2024 r.

Aktualizacje modelu:

Opublikowano gemini-exp-1114, czyli zaawansowany eksperymentalny model interfejsu Gemini API.

8 listopada 2024 r.

Aktualizacje interfejsu API:

Dodano obsługę Gemini w bibliotekach OpenAI / interfejsie API REST.

31 października 2024 r.

Aktualizacje interfejsu API:

Dodaliśmy obsługę funkcji Grounding z użyciem wyszukiwarki Google.

3 października 2024 r.

Aktualizacje modelu:

Opublikowaliśmy gemini-1.5-flash-8b-001, stabilną wersję najmniejszego modelu Gemini API.

24 września 2024 r.

Aktualizacje modelu:

Opublikowaliśmy gemini-1.5-pro-002 i gemini-1.5-flash-002, czyli 2 nowe stabilne wersje Gemini 1.5 Pro i 1.5 Flash, które są ogólnie dostępne.
Zaktualizowano kod modelu gemini-1.5-pro-latest, aby używał funkcji gemini-1.5-pro-002, a kod modelu gemini-1.5-flash-latest, aby używał funkcji gemini-1.5-flash-002.
Wersja gemini-1.5-flash-8b-exp-0924 zastępuje wersję gemini-1.5-flash-8b-exp-0827.
Wprowadziliśmy filtr bezpieczeństwa dotyczący integralności obywatelskiej w Gemini API i AI Studio.
Dodaliśmy obsługę 2 nowych parametrów w modelach Gemini 1.5 Pro i 1.5 Flash w Pythonie i NodeJS: frequencyPenalty i presencePenalty.

19 września 2024 r.

Aktualizacje AI Studio:

Dodaliśmy przyciski „Lubię” i „Nie lubię” do odpowiedzi modelowanych, aby umożliwić użytkownikom wyrażanie opinii na temat jakości odpowiedzi.

Aktualizacje interfejsu API:

Dodano obsługę środków Google Cloud, które można teraz wykorzystać na korzystanie z interfejsu Gemini API.

17 września 2024 r.

Aktualizacje AI Studio:

Dodano przycisk Otwórz w Colab, który eksportuje prompt i kod potrzebny do jego uruchomienia do notatnika Colab. Ta funkcja nie obsługuje jeszcze promptów z narzędziami (tryb JSON, wywoływanie funkcji lub wykonywanie kodu).

13 września 2024 r.

Aktualizacje AI Studio:

Dodano obsługę trybu porównywania, który umożliwia porównywanie odpowiedzi w różnych modelach i promptach, aby znaleźć rozwiązanie najlepiej dopasowane do Twojego przypadku użycia.

30 sierpnia 2024 r.

Aktualizacje modelu:

Gemini 1.5 Flash obsługuje podawanie schematu JSON w ramach konfiguracji modelu.

27 sierpnia 2024 r.

Aktualizacje modelu:

Opublikowaliśmy te modele eksperymentalne:
- gemini-1.5-pro-exp-0827
- gemini-1.5-flash-exp-0827
- gemini-1.5-flash-8b-exp-0827

9 sierpnia 2024 r.

Aktualizacje interfejsu API:

Dodaliśmy obsługę przetwarzania plików PDF.

5 sierpnia 2024 r.

Aktualizacje modelu:

Dodano obsługę dokładnego dopasowania w przypadku Gemini 1.5 Flash.

1 sierpnia 2024 r.

Aktualizacje modelu:

Wprowadziliśmy gemini-1.5-pro-exp-0801, nową wersję eksperymentalną Gemini 1.5 Pro.

12 lipca 2024 r.

Aktualizacje modelu:

Usunięcie obsługi Gemini 1.0 Pro Vision z usług i narzędzi Google AI.

27 czerwca 2024 r.

Aktualizacje modelu:

Opublikowanie Gemini 1.5 Pro z oknem kontekstu o wielkości 2 mln tokenów.

Aktualizacje interfejsu API:

Dodaliśmy obsługę wykonywania kodu.

18 czerwca 2024 r.

Aktualizacje interfejsu API:

Dodaliśmy obsługę buforowania kontekstu.

12 czerwca 2024 r.

Aktualizacje modelu:

Gemini 1.0 Pro Vision zostało wycofane.

23 maja 2024 r.

Aktualizacje modelu:

Gemini 1.5 Pro (gemini-1.5-pro-001) jest ogólnie dostępna (GA).
Gemini 1.5 Flash (gemini-1.5-flash-001) jest ogólnie dostępna (GA).

14 maja 2024 r.

Aktualizacje interfejsu API:

Wprowadziliśmy okno kontekstu o 2 mln tokenów dla Gemini 1.5 Pro (lista oczekujących).
Wprowadziliśmy rozliczenia według wykorzystania w przypadku Gemini 1.0 Pro. Wkrótce udostępnimy rozliczenia Gemini 1.5 Pro i Gemini 1.5 Flash.
Wprowadziliśmy zwiększone limity szybkości dla nadchodzącej płatnej wersji Gemini 1.5 Pro.
Dodano wbudowaną obsługę filmów w interfejsie File API.
Dodano obsługę zwykłego tekstu w interfejsie File API.
Dodano obsługę równoległego wywoływania funkcji, która zwraca więcej niż 1 wywołanie naraz.

10 maja 2024 r.

Aktualizacje modelu:

Wersja gemini-1.5-flash-latest Gemini 1.5 Flash jest dostępna w wersji podglądowej.

9 kwietnia 2024 r.

Aktualizacje modelu:

Wersja gemini-1.5-pro-latest Gemini 1.5 Pro została wydana w wersji wstępnej.
Wprowadziliśmy nowy model wektorów dystrybucyjnych tekstu, text-embeddings-004, który obsługuje rozmiary elastycznego wektora dystrybucyjnego poniżej 768.

Aktualizacje interfejsu API:

Udostępniliśmy interfejs File API do tymczasowego przechowywania plików multimedialnych na potrzeby promptów.
Dodaliśmy obsługę promptów z tekstem, obrazem i danymi audio, czyli promptów multimodalnych. Więcej informacji znajdziesz w artykule Promowanie za pomocą multimediów.
Wprowadziliśmy instrukcje systemowe w wersji beta.
Dodano tryb wywoływania funkcji, który określa sposób wykonywania wywołania funkcji.
Dodano obsługę opcji konfiguracji response_mime_type, która umożliwia żądanie odpowiedzi w formacie JSON.

19 marca 2024 r.

Aktualizacje modelu:

Dodano obsługę dostrajania Gemini 1.0 Pro w Google AI Studio lub za pomocą interfejsu Gemini API.

13 grudnia 2023 r.

Aktualizacje modelu:

gemini-pro: nowy model tekstowy do wykonywania wielu różnych zadań. równowaga między możliwościami a wydajnością,
gemini-pro-vision: nowy multimodalny model do wykonywania różnorodnych zadań. Równoważy możliwości i wydajność.
embedding-001: nowy model wektorów dystrybucyjnych.
aqa: nowy model specjalnie dostosowany do odpowiadania na pytania za pomocą fragmentów tekstu służących do tworzenia odpowiedzi.

Więcej informacji znajdziesz w artykule Modele Gemini.

Aktualizacje wersji interfejsu API:

v1: stabilny kanał interfejsu API.
v1beta: wersja beta. Ten kanał ma funkcje, które mogą być w trakcie tworzenia.

Więcej informacji znajdziesz w temacie wersji interfejsu API.

Aktualizacje interfejsu API:

GenerateContent to jeden zintegrowany punkt końcowy do obsługi czatu i tekstu.
Streaming dostępny za pomocą metody StreamGenerateContent.
Możliwości multimodalne: obraz jest nową obsługiwaną modalnością
Nowe funkcje w wersji beta:
- Wywoływanie funkcji
- Semantic Retriever
- Odpowiadanie na pytania z przypisanym autorem (AQA)
Zaktualizowana liczba kandydatów: modele Gemini zwracają tylko 1 kandydata.
różne kategorie ustawień bezpieczeństwa i SafetyRating. Więcej informacji znajdziesz w ustawieniach zabezpieczeń.
Dostrajanie modeli nie jest jeszcze obsługiwane w przypadku modeli Gemini (praca w toku).