Jak skalować obrazy ze stabilnej dyfuzji

2022/11/21

Artyści cyfrowi i twórcy treści są podekscytowani wykorzystaniem platform głębokiego uczenia się przekształcających tekst na obraz w celu tworzenia niesamowitych obrazów. Tworzenie dokładnych obrazów w oparciu o słowa kluczowe całkowicie zmieniło sposób gry w sztukę cyfrową. Istnieją jednak ogólne skargi od niektórych użytkowników platformy konwersji tekstu na obraz Stable Diffusion. Chociaż wygenerowane obrazy mogą być dokładnie tym, czego szukają, rozmiar obrazu stał się ogromnym rozczarowaniem.

Tworzenie idealnego dzieła sztuki cyfrowej przy użyciu stabilnej dyfuzji jest fantastyczne, ale co z tego, jeśli rozmiar obrazu jest zbyt mały, aby go użyć? Na szczęście istnieją sposoby na skalowanie obrazu. W tym artykule omówimy, jak skalować obrazy ze stabilnej dyfuzji.

Problem z rozmiarem obrazu

Domyślny rozmiar obrazu stabilnej dyfuzji to 512 x 512 pikseli. Ta natywna rozdzielczość jest uważana za małą w dzisiejszym cyfrowym świecie i stwarza problemy dla tych, którzy muszą używać plików utworzonych za pomocą Stable Diffusion w znacznie większym formacie. Model został przeszkolony na zestawach danych obrazu o rozdzielczości 512 x 512, więc jego dane wyjściowe są w tym samym formacie. Jednak większość platform mediów społecznościowych wymaga rozdzielczości 1080 x 1080 do akceptowalnego oglądania, co naprawdę podkreśla, jak ważna jest rozdzielczość obrazu.

Stabilna dyfuzja pozwala na stworzenie idealnego obrazu spełniającego wszystkie życzenia projektanta. Jeśli jednak rozmiar pliku jest tak mały, że czyni go bezużytecznym, pojawia się poważny dylemat. Po prostu przeciągnięcie i upuszczenie obrazu do aplikacji oraz zwiększenie jego rozmiaru poważnie pogorszy jakość obrazu, najprawdopodobniej gorszą niż oryginalny plik. Obrazy o tak niskiej rozdzielczości nie są dobrze drukowane, a także nie można ich umieścić w programie Photoshop w celu edycji zgodnie z wymaganiami projektanta.

Jak skalować obrazy ze stabilną dyfuzją

Na szczęście istnieją sposoby skalowania obrazu o niskiej rozdzielczości utworzonego za pomocą stabilnej dyfuzji. Niektórzy użytkownicy byli kreatywni w opracowywaniu metod, aby to osiągnąć. Jedną z trudnych i czasochłonnych metod jest podzielenie obrazu na mniejsze części o wymiarach 512 x 512, a następnie ponowne ich złożenie. Inni używają specjalnych algorytmów do konwersji obrazów AI do formatów o wyższej rozdzielczości.

maływow

Istnieje wiele narzędzi online, których można użyć do skalowania obrazów. Jednak większość z tych narzędzi wymaga utworzenia konta internetowego przy użyciu adresu e-mail lub opłacenia usług. Jeśli szukasz darmowego narzędzia, którego można używać niezliczoną ilość razy bez subskrypcji, TinyWow to świetny wybór.

Przejdź do programu TinyWow Image Upscaler .
„Prześlij” lub „Przeciągnij i upuść plik”, który chcesz powiększyć.
Po przesłaniu kliknij „Powiększ”, aby wybrać żądane ulepszenie obrazu.
Kiedy skończysz, kliknij „Powiększ”.
Voila! Możesz „przesłać” swoje zdjęcia i zapisać je na swoim komputerze lub zapisać, skanując „kod QR”, aby zapisać je na telefonie komórkowym.

Użyj chainnera, aby powiększyć

Możesz powiększać obrazy stabilnej dyfuzji w łańcuchu. Jest to GUI (GUI) przetwarzania obrazu oparty na schemacie blokowym / węzłach, który pomaga łączyć zadania przetwarzania obrazu w łańcuch. Jego mocną stroną jest skalowanie obrazu. Będziesz mieć pełną kontrolę nad potokiem przetwarzania, łącząc węzły. To sprawia, że niezwykle trudne zadania są znacznie łatwiejsze, pozwalając chainNerowi wykonać pracę za Ciebie.

Działa z systemami Windows, macOS i Linux. Jeśli jesteś nowy w GUI, chainNer może początkowo wydawać się zniechęcający. Na szczęście używanie chainNNer do skalowania obrazów jest łatwe. Przeciągając i upuszczając określone węzły, możesz dostosować schemat blokowy procesu, aby wykonać całą ciężką pracę. Oto jak zacząć używać chainNer:

Korzystając z komputera, przejdź do Github i pobierz odpowiednią wersję chainNer.
Po zakończeniu procesu instalacji uruchom aplikację.
Załaduj „Iterator pliku obrazu”, wybierając go z menu lewego panelu i przeciągając w prawo.
Kliknij pole z napisem „Wybierz katalog” i wybierz obraz, który chcesz powiększyć.
Przejdź do żądanego folderu i kliknij „Wybierz folder”.

Należy zauważyć, że wszelkie inne obrazy znajdujące się w wybranym katalogu również zostaną przetworzone. Jeśli chcesz powiększyć tylko jeden obraz, musisz najpierw usunąć wszystkie inne znajdujące się w tym samym katalogu. Ponieważ jednak proces skalowania zajmuje dużo czasu, dla użytkownika przydatne będzie posiadanie wszystkich obrazów wymagających skalowania w tym samym folderze, aby chainNNer mógł je skalować w tym samym czasie. Gdy masz już odpowiedni obraz lub obrazy w tym samym katalogu, możesz przejść do kolejnych kroków.

Kliknij i przeciągnij „Powiększony obraz” z menu po lewej stronie i upuść go w dowolnym miejscu dużego okna po prawej stronie.
Znajdź pole „Prześlij obraz” i poszukaj słowa „Obraz”. Kliknij słowo „Obraz” i przeciągnij je do pola „Obraz w dużej skali” i upuść na słowo „Obraz” w polu „Obraz w dużej skali”. Teraz zobaczysz linię łączącą oba pola.
Korzystając z menu lewego panelu, kliknij i przeciągnij „Załaduj model” i przeciągnij go do okna po prawej stronie.
W polu Załaduj model kliknij i przeciągnij linię ze słowa Model do pola Powiększ obraz obok słowa Model.
Wróć do pola Załaduj model i kliknij Wybierz plik znajdujący się w sekcji Wstępnie wytrenowany model.
Wybierz odpowiedni model dla używanego typu obrazu.

Następnie musisz sprawdzić, jak bardzo ten model przeskaluje wybrany obraz. Rozmiary skali są wstępnie ustawione, więc przed rozpoczęciem procesu należy upewnić się, że są wystarczająco duże. Jeśli potrzebujesz obrazu większego niż podany rozmiar, możesz dwukrotnie uruchomić ten proces, aby podwoić jego rozmiar. Oto jak to zrobić:

W lewym okienku kliknij „Prześlij obraz” i przeciągnij go do prawego okienka.
Kliknij „Wybierz plik” u góry okna. Przejdź do obrazu, który chcesz powiększyć, i kliknij Otwórz.
Kliknij obraz i przeciągnij linię do pola „Obraz wysokiej jakości” i upuść ją na słowo „Obraz”.
U dołu okna High Scale Image zobaczysz rozmiar obrazu wyjściowego.
Jeśli nie jest wystarczająco duży, możesz podwoić jego rozmiar, powielając „Pudełko obrazu o wysokiej rozdzielczości” i umieszczając je obok pierwszego.
Teraz kliknij i przeciągnij linię z oryginalnego pola do nowego. Robisz to, przeciągając linię z dołu oryginalnego pola z napisem „Obraz wysokiej jakości” i kończąc ją w nowym polu z napisem „Obraz”.
Z pola Załaduj model przeciągnij linię z modelu do miejsca, w którym jest napisane Model w polu duplikatu. Możesz sprawdzić nowy, zwiększony rozmiar, patrząc na dół tego nowego pudełka.
Kliknij i przeciągnij „Zapisz obraz” z menu lewego panelu i przeciągnij go w prawo.
Korzystając z drugiego pola, Powiększ obraz, przeciągnij linię z miejsca, w którym jest napisane Powiększ obraz, i upuść ją w polu Zapisz obraz obok słowa Obraz.
W tym samym polu wprowadź nazwę pliku skalowanego oraz lokalizację folderu docelowego.

Pomocne byłoby posiadanie określonego folderu oznaczonego Powiększone obrazy, aby można było przechowywać oryginalny obraz w jednym folderze, a powiększony obraz w innym. Gdy będziesz zadowolony ze wszystkiego, kliknij zieloną strzałkę u góry ekranu, aby rozpocząć proces. Linie, które narysujesz, zaczną się animować i będą to robić aż do zakończenia procesu.

Proces skalowania jest bardzo czasochłonny i może zająć kilka godzin. Jednak po zakończeniu procesu możesz przetestować swoje obrazy, otwierając je z powiększonego folderu obrazów lub z dowolnego folderu określonego dla ostatecznego obrazu. Należy pamiętać, że powiększone obrazy będą znacznie większe niż ich oryginały. Niezwykle ważne jest upewnienie się, że masz wystarczającą ilość miejsca na dysku przed rozpoczęciem procesu skalowania.

Korzystanie z chainNNer może wydawać się skomplikowane, ale kiedy już oswoisz się z jego funkcjami schematu blokowego, jest w rzeczywistości dość łatwy w użyciu. Używanie węzłów i łączenie ich łańcuchami (liniami) pokazuje dokładnie, jak będzie funkcjonował cały proces i świetnie nadaje się do wizualizacji.

Inne problemy ze stabilną dyfuzją

Oprócz domyślnego rozmiaru obrazu 512 x 512, istnieją inne godne uwagi problemy zgłaszane przez użytkowników Stable Diffusion.

Renderowanie twarzy może być czasami problematyczne, zwłaszcza gdy pożądany rezultat jest fotorealistyczny. Dla twórców, którzy potrzebują anime lub surrealistycznej twarzy, zwykle nie stanowi to problemu. Jeśli jednak szukasz autentycznego i naturalnego wyglądu, czasami Stabilna dyfuzja może nie zadziałać. Wynika to z faktu, że nie ma możliwości ustawienia ostrości obrazu generowanego przez sztuczną inteligencję tylko na twarzy. Możesz jednak powiększyć i zmienić mapowanie twarzy, aby uzyskać lepsze wyniki.

Kolejnym problemem, na który warto zwrócić uwagę, jest poprawny rysunek ludzkich kończyn. Ponownie, ma to znaczenie tylko wtedy, gdy chcesz, aby pożądany obraz był fotorealistyczny. Czasami kończyny są wizualizowane nieprawidłowo lub w nienaturalnej pozycji. Użytkownicy zgłaszali, że obrazy są tworzone z dodatkowymi kończynami, a czasem z dodatkowymi palcami dłoni.

Problemy te powinny stać się rzadsze, ponieważ badacze ze Stable Diffusion dodają więcej zestawów danych i poprawiają swoje algorytmy.

Łatwo skaluj stabilne obrazy dyfuzyjne za pomocą chainNer

Stable Diffusion to ciekawy framework do konwersji tekstu na obraz. Chociaż tworzy małe pliki o niskiej rozdzielczości, można je skalować. Chociaż może to zająć dużo czasu, ten proces jest niezbędny, jeśli chcesz dalej edytować obraz lub przygotować go do druku. Z pomocą łańcuszka obrazy można znacznie powiększyć bez utraty jakości.

Czy próbowałeś skalować obraz utworzony za pomocą Stable Diffusion? Czy używałeś channera? Daj nam znać w komentarzach poniżej.