Google wprowadza wysokiej jakości model przekształcania tekstu w obraz Imagen 3 dla użytkowników Gemini

2024/10/12

Na początku tego roku Google zaprezentowało Imagen 3, swój najbardziej zaawansowany model generowania tekstu na obraz do tej pory. Ta zaktualizowana wersja przynosi liczne ulepszenia jakości i dokładności obrazu. Według Google, Imagen 3 osiąga wyjątkowy poziom szczegółowości, tworząc fotorealistyczne obrazy, które wykazują minimalne rozpraszające artefakty w porównaniu do swojego poprzednika, Imagen 2.

Niedawno Google udostępniło model Imagen 3 wszystkim użytkownikom Gemini na całym świecie. Dzięki temu uruchomieniu zarówno standardowi użytkownicy Gemini, jak i Gemini Advanced mogą opisywać wizualizacje, które chcą wygenerować, a Gemini wygeneruje odpowiedni obraz za pomocą AI. Należy jednak pamiętać, że tylko osoby z dostępem Gemini Advanced mogą generować obrazy przedstawiające postacie ludzkie.

Jeśli wygenerowany obraz nie spełnia Twoich oczekiwań, możesz go doprecyzować, podając dodatkowe szczegóły w swoim żądaniu. Im dokładniej określisz swój obraz, tym dokładniejsze wyniki dostarczy Gemini. Ulepszony model Imagen 3 wykazuje większe zrozumienie języka naturalnego i ukrytego zamiaru kryjącego się za monitami, a nawet wychwytuje niuanse szczegółów z rozszerzonych opisów.

Innym obszarem, w którym Imagen 3 się wyróżnia, jest renderowanie tekstu, aspekt, który stanowił wyzwanie dla wielu współczesnych modeli generowania obrazów. Ta funkcja pozwala użytkownikom tworzyć niestandardowe życzenia urodzinowe, lokalizacje oznaczone znakami i różne inne spersonalizowane prośby.

Poznaj możliwości modelu Imagen 3 na platformie Gemini tutaj .

Źródło

Dodaj komentarz Anuluj pisanie odpowiedzi