Google zapewnia przełom w zrozumieniu długiego kontekstu dzięki Gemini 1.5

2024/02/16

Google ogłosił, że wypuszcza Gemini 1.5 Pro do wczesnych testów za pośrednictwem AI Studio. Jednym z kluczowych celów tej nowej aktualizacji modelu jest jej zdolność do zrozumienia treści o długim kontekście, obsługujących początkowo okno kontekstowe zawierające 128 000 tokenów, ale ambicjami jest skalowanie tego do 1 miliona tokenów.

Według dokumentu technicznego opublikowanego przez Google, Gemini 1.5 Pro działa lepiej niż zarówno 1.0 Pro, jak i 1.0 Ultra. W porównaniu do Ultra, 1.5 Pro ma współczynnik wygranych funkcji podstawowych na poziomie 54,8%, współczynnik wygranych tekstów na poziomie 77%, współczynnik wygranych funkcji Vision na poziomie 46% i współczynnik wygranych dźwięku na poziomie 20%. Działa znacznie lepiej niż 1.0 Pro, uzyskując odpowiednio 87,1%, 100%, 77% i 60%.

Oto niektóre z najważniejszych cech tego modelu:

Rozumowanie na temat ogromnej ilości informacji

Gemini 1.5 Pro może analizować i podsumowywać 402-stronicowe transkrypcje z misji Apollo 11 na Księżyc.

Lepsze zrozumienie różnych modalności

Gemini 1.5 Pro może wykonywać bardzo wyrafinowane zadania rozumowania dla różnych modalności, jak niemy film Bustera Keatona.

Rozwiązywanie problemów przy użyciu dłuższych bloków kodu

Gemini 1.5 Pro może analizować 100 000 linii kodu, podając pomocne rozwiązania, modyfikacje i wyjaśnienia.

Dyrektor generalny Google, Sundar Pichai, tak powiedział o nowej wersji Gemini:

„Nasze zespoły w dalszym ciągu przesuwają granice naszych najnowszych modeli, mając na celu bezpieczeństwo. Robią szybkie postępy. Właściwie jesteśmy gotowi wprowadzić następną generację: Gemini 1.5. Pokazuje radykalną poprawę w wielu wymiarach, a 1.5 Pro osiąga jakość porównywalną do 1.0 Ultra, zużywając przy tym mniej mocy obliczeniowej.

Ta nowa generacja zapewnia również przełom w rozumieniu długiego kontekstu. Udało nam się znacznie zwiększyć ilość informacji, które nasze modele mogą przetwarzać — stale obsługując do 1 miliona tokenów, co pozwala uzyskać najdłuższe okno kontekstowe spośród wszystkich wielkoskalowych modeli podstawowych”.

Jeśli chcesz uzyskać wcześniejszy dostęp do Gemini Pro 1.5, wypełnij ten formularz Google AI Studio . Firma Google nie podała harmonogramu udostępnienia tej aktualizacji wszystkim użytkownikom, ale stanie się to po zakończeniu testów.

Źródło: Google

Dodaj komentarz Anuluj pisanie odpowiedzi