Najnowsza sztuczna inteligencja Alibaba pokonuje GPT-3.5, Claude w wielu testach porównawczych

2024/02/07

To nie jest porada inwestycyjna. Autor nie zajmuje pozycji w żadnej z wymienionych spółek.

Rok 2024 stanowi mocny początek globalnego wyścigu sztucznej inteligencji, chiński gigant technologiczny Alibaba Group ogłosił również najnowszą wersję swojego modelu sztucznej inteligencji Qwen. Oprócz ChatGPT firmy OpenAI, który jest najbardziej znanym chatbotem AI na świecie, inne modele, takie jak Meta’s Llama i Claude, partner Amazona, Anthropic, to kilka opcji, z których korzystają konsumenci i firmy przy wyborze platformy AI odpowiadającej ich potrzebom.

Najnowszą wersją Qwen Alibaba jest Qwen 1.5 i według testów porównawczych udostępnionych na platformie mediów społecznościowych X, model ten pokonuje zarówno ChatGPT, jak i Claude w niektórych wynikach testów porównawczych.

Qwen 1.5 firmy Alibaba pokonuje Claude i ChatGPT w wielu testach porównawczych testujących płynność nauczania

Podobnie jak systemy operacyjne działające na komputerach czy smartfonach, model sztucznej inteligencji również jest oprogramowaniem. Pozwala to inżynierom oprogramowania i analitykom ocenić jego wydajność, a jeśli chodzi o najnowszą wersję Qwen 1.5 Alibaba, niektóre wyniki pokazują, że przewyższa ona Claude firmy Anthropic i ChatGPT firmy OpenAI.

Testy porównawcze testujące systemy operacyjne oceniają ich zdolność do przetwarzania instrukcji i uruchamiania aplikacji, natomiast testy dotyczące modeli sztucznej inteligencji zazwyczaj koncentrują się wokół nich, testując zdolność modeli do generowania wyników.

Dwa takie testy porównawcze to MT-bench i Alapaca-Eval, a wyniki udostępnione na X pokazują, że wariant Qwen 1.5 Alibaba przewyższył w nich ChatGPT i Claude. MT-bench testuje zdolność modelu do odpowiadania na zestaw wcześniej zdefiniowanych pytań, które nie tylko mają na celu odróżnienie go od chatbota, ale także próbują określić, czy model może „utrzymać się na pozycji” w trudnych warunkach konwersacyjnych, w których dwie strony szybko się angażują ze sobą.

Wyniki testów porównawczych pokazują, że Qwen był czwartym najlepszym wynikiem w MT-bench i pozostawał jedynie w tyle za GPT-4 Turbo i dwoma pierwszymi wydaniami GPT-4, a mianowicie wersjami 0613 i 0314.

Alibaba wypuszcza Qwen 1.5

demonstracja: https://t.co/goMcWMsIzT

największy Qwen1.5-72B-Chat o otwartym kodzie źródłowym, wykazuje doskonałą wydajność, przewyższającą Claude-2.1, GPT-3.5-Turbo-0613, zarówno na MT-Bench, jak i Alpaca-Eval v2 pic.twitter.com/50dNuUpEBx

— AK (@_akhaliq) 5 lutego 2024 r

Alapaca-Eval to benchmark, w którym wykorzystuje się model referencyjny do emulacji interakcji międzyludzkich i określa, w jakim stopniu testowany model sztucznej inteligencji zapewnia wyniki zgodne z wartościami bazowymi. Zapewnia także użytkownikom tablicę wyników umożliwiającą śledzenie ich testów, a dzisiejsze testy porównawcze pokazują, że wydajność Qwen 1.5 w Alapaca-Eval pozostaje jedynie w tyle za GPT-4 Turbo i nowojorskim HuggingFace Yi-34B.

Qwen1.5 to jeden z największych tego typu modeli open source, wspierany przez ogromne zasoby obliczeniowe Alibaba. Sztuczna inteligencja typu open source, podobnie jak oprogramowanie typu open source, udostępnia swój kod użytkownikom i programistom, aby mogli zrozumieć model i tworzyć własne warianty. Lama Meta, obecna również w dzisiejszych partyturach, jest również modelem open source.

Początek 2024 r. był świadkiem głośnego skupienia się Wall Street i firm na AI Raporty o zarobkach gigantów technologicznych o dużej kapitalizacji, takich jak Meta, Microsoft i Alphabet, skupiały się na szefie AI Meta Mark Zuckerberg zamierza kupić w tym roku setki tysięcy procesorów graficznych do zasilania up Llama, a podczas rozmowy telefonicznej dotyczącej wyników finansowych dyrektor wyjaśnił, że jego decyzja o zwiększeniu mocy obliczeniowej Meta wynika z wcześniejszych przeoczeń, które doprowadziły do niedostatecznych mocy produkcyjnych firmy.

Podobnie w przypadku zysków producentów i projektantów chipów TSMC i AMD również ich zarządy wyraziły optymizm co do przyszłości sztucznej inteligencji Kierownictwo TSMC jest przekonane, że firma ma stabilne podstawy, aby zaspokoić każdy popyt na sztuczną inteligencję, natomiast AMD jest zdania, że sztuczna inteligencja może zakończyć się do końca dekady będzie wart setki miliardów dolarów.

Qwen 1.5 firmy Alibaba pokonuje Claude i ChatGPT w wielu testach porównawczych testujących płynność nauczania

Dodaj komentarz Anuluj pisanie odpowiedzi