Google prezentuje zaawansowane modele serii Gemini 1.5 i obniża cenę API o 50%

2024/09/24

Dzisiaj Google zaprezentowało dwa ulepszone modele Gemini 1.5 gotowe do produkcji: Gemini-1.5-Pro-002 i Gemini-1.5-Flash-002. Najnowsze modele oferują stopniowe udoskonalenia w porównaniu z oryginalnymi modelami Gemini 1.5 wydanymi w maju.

Zmienione modele serii Gemini 1.5 osiągają około 7% wzrostu w MMLU-Pro, około 20% poprawy w testach porównawczych MATH i HiddenMath oraz ulepszenia od 2% do 7% w scenariuszach wizji i kodowania. Ponadto Google udoskonaliło ogólną przydatność odpowiedzi modelu. Te modele generują teraz odpowiedzi w bardziej zwięzłym formacie, przy czym domyślna długość wyjścia jest około 5% do 20% krótsza niż w przypadku ich poprzedników.

Oprócz udoskonalenia funkcjonalności modelu, Google wprowadza również znaczącą zmianę w cenniku: obniża koszty interfejsów API modeli Gemini serii 1.5.

64% obniżki kosztów tokenów wejściowych.
52% obniżki na tokeny wyjściowe.
64-procentowy spadek przyrostowych tokenów w pamięci podręcznej dla Gemini 1.5 Pro, obowiązujący od 1 października 2024 r. dla monitów poniżej 128 tys. tokenów.

Google podnosi również limity szybkości, umożliwiając programistom tworzenie zaawansowanych aplikacji AI. Limity szybkości w ramach płatnego poziomu dla modelu Gemini 1.5 Flash wynoszą teraz 2000 RPM, podczas gdy dla modelu Pro wzrosły do 1000 RPM, w porównaniu z odpowiednio 1000 i 360. Ponadto te nowe modele zapewniają zmniejszenie opóźnień, oferując programistom oczekiwane wyniki, które są dwa razy szybsze i mają trzy razy mniejsze opóźnienia.

Wraz z wprowadzeniem zaktualizowanego Gemini 1.5 (modele -002) Google zwiększyło zdolność modelu do przestrzegania instrukcji użytkownika przy jednoczesnym zachowaniu protokołów bezpieczeństwa. Domyślnie Google nie będzie egzekwować filtrów bezpieczeństwa treści AI w tych najnowszych modelach; zamiast tego programiści mogą stosować filtry w oparciu o swoje konkretne potrzeby.

Wreszcie Google wypuściło ulepszoną wersję modelu Gemini 1.5 znaną jako „Gemini-1.5-Flash-8B-Exp-0924”. Ta eksperymentalna wersja prezentuje znaczące ulepszenia wydajności zarówno w aplikacjach tekstowych, jak i multimodalnych. Wszystkie te zaktualizowane modele Gemini 1.5 są teraz dostępne dla programistów za pośrednictwem Google AI Studio i Gemini API. Dla większych przedsiębiorstw i klientów Google Cloud te świeżo zaktualizowane modele Gemini 1.5 są dostępne w Vertex AI.

Źródło

Dodaj komentarz Anuluj pisanie odpowiedzi