Czym jest sztuczna inteligencja Google „Gemma” i czym różni się od sztucznej inteligencji Gemini

Czym jest sztuczna inteligencja Google „Gemma” i czym różni się od sztucznej inteligencji Gemini

Przez ostatnie kilka tygodni Google intensywnie ćwiczyło sztuczną inteligencję. Najpierw firma wypuściła modele Gemini Advanced i 1.5 Pro, a teraz technologiczny gigant jest tutaj z Gemma AI.

Gemma to rodzina lekkich modeli sztucznej inteligencji o otwartym kodzie źródłowym, opartych na ich flagowych modelach Gemini. Do zbudowania tych najnowocześniejszych modeli wykorzystano te same technologie i badania, które wykorzystano przy tworzeniu Gemini. Możesz myśleć o Gemmie jako o młodszym rodzeństwie Bliźniąt.

Co to jest Gemma

Zaprojektowana dla programistów, Gemma koncentruje się na udostępnianiu możliwości sztucznej inteligencji codziennym programistom AI, ponieważ mogą oni działać na różnych typach sprzętu konsumenckiego (laptopy, środowiska chmurowe lub standardowe stacje robocze) bez potrzeby posiadania rozległych zasobów obliczeniowych wymaganych przez Gemini.

Rozmiary:

Gemma jest obecnie dostępna w dwóch rozmiarach: 2B i 7B (parametry), a każdy model występuje w dwóch wariantach, podstawowym (wstępnie przeszkolonym) i dostrojonym według instrukcji.

Google odfiltrował dane osobowe i inne wrażliwe dane z zestawów szkoleniowych, aby wstępnie wytrenowane modele były bezpieczne i niezawodne.

W przypadku modeli dostosowanych do instrukcji firma zastosowała szeroko zakrojone dostrajanie i uczenie się przez wzmacnianie na podstawie informacji zwrotnych od ludzi (RLHF), aby dostosować modele do odpowiedzialnego zachowania.

Dostęp do Gemmy:

Rozpoczęcie pracy z Gemmą jest łatwe, ponieważ jest ona zintegrowana z popularnymi narzędziami, takimi jak HuggingFace, Kaggle, NVIDIA NeMo, MaxText itp. Wdrożenie w Google Cloud jest również łatwe dzięki Vertex AI i Google Kubernetes Engine (GKE).

Został również zoptymalizowany pod kątem platform sprzętowych AI, takich jak procesory graficzne NVIDIA i TPU Google Cloud.

Dostępność:

Dostępne na całym świecie modele Gemmy będą obecnie działać wyłącznie w języku angielskim, a Google ma nadzieję na rozwój w przyszłości. Ze względu na swój niewielki rozmiar najlepiej nadają się również do zadań związanych z językiem, takich jak odpowiadanie na pytania, podsumowywanie i rozumowanie.

Programiści mogą dostroić modele Gemma do swoich aplikacji pod kątem zadań takich jak podsumowywanie lub generowanie wspomagane wyszukiwaniem (RAG).

Ponieważ trudniej jest postawić barierki w modelach o otwartym kodzie źródłowym, modele Gemma są dostarczane z odpowiedzialnymi zestawami narzędzi AI, umożliwiającymi programistom tworzenie własnych wytycznych podczas korzystania z Gemmy.

Gemma kontra Bliźnięta

Gemini jest dostępne dla klientów końcowych za pośrednictwem aplikacji internetowej , aplikacji na Androida lub aplikacji Google na iOS . Ale modele Gemma są przeznaczone tylko dla programistów.

Programiści mogą uzyskać dostęp do Gemini poprzez interfejsy API lub Vertex AI, co czyni go modelem zamkniętym. Dla porównania, Gemma to model typu open source, łatwo dostępny dla programistów, badaczy i firm w celu eksperymentowania i integracji z ich własnymi aplikacjami.

Modele Gemini są również masywne i często wymagają specjalistycznego sprzętu do centrum danych. Natomiast Gemma jest mniejsza, co czyni ją znacznie bardziej przenośną i tańszą w obsłudze.

Chociaż oba można dostroić, Gemma została zbudowana z myślą o dostosowaniu. Programiści mogą łatwiej dostosować modele Gemma do pracy z określonymi typami danych lub wykonywania specjalistycznych zadań.

Modele Gemma, zwłaszcza Gemma 7B, wypadły w testach porównawczych porównywalnie z innymi podobnymi modelami LLM, takimi jak Llama 2 7B czy Mistral 7B. Gemma reprezentuje wysiłki Google mające na celu zwiększenie dostępności i możliwości dostosowania zaawansowanych modeli sztucznej inteligencji. Firma planuje także wypuszczenie większej liczby wariantów w przyszłości w miarę poszerzania rodziny Gemma.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *