Czy procesory graficzne zużywają się podczas intensywnego użytkowania?

Czy procesory graficzne zużywają się podczas intensywnego użytkowania?

Jeśli planujesz intensywną grę, przetwarzanie GPU, renderowanie grafiki, Folding@home lub wydobywanie kryptowalut na swoim GPU, możesz martwić się, że Twój GPU zużyje się podczas intensywnego użytkowania. Ale czy tak będzie? Zbadamy.

Tak, ale to trudne

Wiele informacji, które można znaleźć w Internecie na temat żywotności kart graficznych, jest niepotwierdzonych, a liczby mogą się znacznie różnić w zależności od tego, kogo zapytasz. Przy setkach różnych modeli kart graficznych wydanych w ciągu ostatniej dekady trudno jest zawęzić dane dotyczące tak bardzo różnych kart do zwykłych uogólnień.

Jak dotąd wiemy, że: według raportu niemieckiego sprzedawcy z 2020 r ., najnowsze karty graficzne mają ogólny wskaźnik awaryjności około 2-5% (mierzony w zwrotach do sprzedawcy). A w 2021 r. Nvidia nadal wypuszczała aktualizacje sterowników dla kart, które miały około 9-10 lat (takich jak seria GTX 600), więc można spodziewać się dekady dobrze wykonanej karty GPU, chociaż mogą to być odstające, jak my Zobaczymy dalej.

Niezależnie od liczb, działa tu ciężka fizyka. Materiały i komponenty używane w kartach GPU nie są magiczne: im częściej ich używasz, tym szybciej się zużywają i tym bardziej prawdopodobne jest, że ulegną całkowitej awarii. Tak intensywne użytkowanie wpływa na długość życia.

To, czy zauważysz usterkę na karcie GPU, zależy od zupełnie innych zmiennych, takich jak intensywność wykorzystania GPU, charakter i zakres wahań temperatury w obwodzie, ile razy karta była włączana i wyłączana oraz poziom czystości środowisko operacyjne jest.

Ponieważ karta GPU jest złożonym urządzeniem składającym się z wielu części, każda z nich może ulec awarii lub degradacji na swój sposób. Przyjrzymy się kilku głównym częściom karty GPU i zobaczymy, jak mogą one z czasem ulec zużyciu podczas intensywnego użytkowania.

Po pierwsze: wentylatory chłodzące

Ze wszystkich części karty graficznej, które mogą ulec awarii, musimy wskazać na wentylatory chłodzące (lub wentylatory), które są fizycznymi ruchomymi częściami. Wentylatory chłodzą GPU, odciągając gorące powietrze z układu GPU (z radiatorem), dzięki czemu może on dalej działać.

Dlaczego upał jest zły? Przy wystarczającej ilości ciepła tranzystory nie działają prawidłowo , co oznacza, że ​​karta graficzna nie będzie działać. Przy jeszcze większym nagrzaniu tranzystory w mikroukładach karty mogą ulec nieodwracalnemu uszkodzeniu .

Z biegiem czasu wentylatory chłodzące często zapychają się kurzem, zmniejszając ich zdolność do wydajnego przenoszenia powietrza. Lub wentylatory mogą ulec całkowitej awarii, jeśli zawiedzie wewnętrzne smarowanie. Każdy skrypt podniesie temperaturę GPU.

Każdy procesor graficzny chroni się przed przegrzaniem za pomocą dławienia termicznego, które spowalnia procesor graficzny w celu obniżenia jego temperatury roboczej. To poważnie ogranicza wydajność. Jeśli więc masz GPU, który nagle pracuje głośniej niż normalnie (wentylator obraca się szybciej) lub działa gorzej, dokładnie wyczyść wentylatory i radiator GPU za pomocą sprężonego powietrza.

Jeśli wentylator chłodzący GPU całkowicie się zepsuł, zwykle można go wymienić, jeśli znajdziesz podobny wentylator u dostawcy części komputerowych.

Kolejny podejrzany: wadliwa pasta termiczna

Pomiędzy każdym radiatorem a układem GPU znajduje się warstwa materiału przewodzącego ciepło, takiego jak kit lub pasta, która pomaga w przenoszeniu ciepła z układu GPU do radiatora.

Z biegiem czasu pasta termiczna może pękać lub tracić skuteczność. W takim przypadku radiator nie jest chłodzony tak wydajnie, a temperatura GPU wzrasta. Jak widzieliśmy w powyższej sekcji wentylatorów, wysokie temperatury GPU prowadzą do dławienia termicznego, co spowalnia GPU.

Najlepszym rozwiązaniem w tym przypadku jest samodzielna wymiana pasty termicznej . Pastę termiczną można kupić od dostawców sprzętu komputerowego.

Błędy w innych podzespołach, lutować

Oprócz układu GPU karta graficzna będzie zawierać dziesiątki innych elementów elektronicznych, takich jak kondensatory, rezystory, układy pamięci i wiele innych. Każdy z nich może potencjalnie zawieść z powodu intensywnego użytkowania lub narażenia na zbyt duże ciepło. Niektóre są bardziej podatne na porażkę niż inne.

W szczególności kondensatory z czasem ulegają awarii . Są wrażliwe na częste wahania temperatury, a niektóre z nich mają wady już w pierwszej produkcji. Jeśli jesteś wystarczająco bystry, aby rozwiązywać problemy z kondensatorami, możesz potencjalnie wymienić wadliwe kondensatory na karcie GPU, jeśli znajdziesz równoważne części zamienne.

Ponadto lut, który łączy chipy i komponenty z płytką drukowaną karty graficznej, może się z czasem starzeć i pękać z powodu częstych zmian temperatury, nieostrożnego obchodzenia się, niewłaściwego przechowywania lub przegrzania. A więc tak, intensywne użycie GPU może zwiększyć ryzyko awarii połączenia lutowanego. Naprawa złych połączeń lutowanych może być technicznie trudna, ale nie niemożliwa .

Awarie samego układu GPU

Pozostaje więc pytanie: czy chip GPU może z czasem ulec zużyciu przy intensywnym użytkowaniu? Odpowiedź brzmi: teoretycznie tak, w ekstremalnych okolicznościach. Ale najprawdopodobniej zobaczysz awarię innego komponentu karty graficznej na długo przed tym.

Układ GPU na twojej karcie graficznej zawiera miliony lub miliardy tranzystorów wytrawionych w kawałku krzemu. Tranzystory starzeją się z czasem , co wpływa na ich wydajność. Gdy wystarczająca liczba tranzystorów pójdzie nie tak, chip ulegnie awarii.

Według Semiconductor Engineering istnieje kilka głównych powodów, dla których tranzystory z czasem ulegają awarii z powodu starzenia ( jednym z nich jest ciepło ), a im mniejszy element na chipie, tym bardziej prawdopodobne są błędy. Eksperci podejrzewają, że chipy komputerowe produkowane dzisiaj nie będą trwać tak długo, jak chipy wyprodukowane w latach 90., ale przewidywanie dokładnej długości życia jest nadal zgadywaniem, ponieważ technologia jest tak nowa.

NVIDIA nie publikuje obecnie wskaźników MTBF (średni czas między awariami) dla swoich konsumenckich kart graficznych, ale firma  publikuje je dla niektórych swoich przemysłowych i biznesowych akceleratorów graficznych. Na przykład w arkuszu danych akceleratora GPU Tesla K20X podano, że MTBF karty (w temperaturze 35°C/95F) wynosi 14,7 roku dla „środowiska niekontrolowanego” i 23,8 roku dla „środowiska kontrolowanego”. (Zauważ, że ogólnie przemysłowy sprzęt graficzny jest uważany za bardziej niezawodny i lepiej wytrzymujący intensywne użytkowanie niż sprzęt graficzny dla konsumentów).

Co ciekawe, możemy porównać tę teoretyczną liczbę z dokładnymi danymi uzyskanymi w terenie. Jedno z niewielu badań empirycznych dotyczących żywotności GPU pochodzi z artykułu z 2020 r. zatytułowanego „ GPU Lifespan on the Titan Supercomputer: Survival and Reliability Analysis ” autorstwa Oak Ridge National Laboratory. W artykule opisano niezawodność 18 688 kart graficznych Nvidia K20X Kepler używanych w wycofanym obecnie superkomputerze Cray XK7 Titan przez prawie 7 lat (2012-2019).

Po kilku początkowych awariach spowodowanych problemami z łącznością stwierdzili, że karty graficzne XK7 są stosunkowo wysoce niezawodne do 2016 roku (około 3-4 lat), kiedy wiele z nich zaczęło zawodzić. Ale wiesz co? Większość usterek w pierwszej partii kart (przed ich wymianą) przypisano do wadliwego rezystora na płytce drukowanej karty graficznej, a nie do samego układu GPU. Ogólnie rzecz biorąc, autorzy badania stwierdzili, że MTBF intensywnie używanych kart graficznych K20X wynosi około 3 lat (nie 14-23 lat, jak podano w arkuszu danych Nvidii), a niektóre z najgorętszych kart w rdzeniu zawodzą jako pierwsze. Doszli do wniosku, że „niezawodność GPU zależy od rozpraszania ciepła”.

Jest więc duże prawdopodobieństwo, że jeśli będziesz używać karty graficznej tak ciężko, jak jeden z największych superkomputerów na świecie (w tamtym czasie), będzie się ona szybciej zużywać, a inne komponenty, takie jak wentylatory i rezystory, ulegną awarii na długo przed awarią samego układu GPU. długo otrzymasz zależy od czynników, których nie możemy przewidzieć.

W końcu ciepło jest wrogiem

Ostatecznie, ze wszystkich źródeł, które przeczytaliśmy, najważniejszym czynnikiem decydującym o tym, jak długo wytrzyma karta GPU, jest jej temperatura. Im gorętsza karta, tym szybciej ulegają degradacji wszystkie jej komponenty. Ponadto im gorętsza karta, tym bardziej zmniejsza wydajność, aby zapobiec katastrofalnej awarii. Dobre chłodzenie przedłuża żywotność karty i poprawia jej wydajność.

Niezależnie od tego, czy interesujesz się kryptowalutami, czy grami, o ile twoja karta graficzna jest wystarczająco chłodna z czystymi wentylatorami i skuteczną pastą termoprzewodzącą, prawdopodobnie będziesz mieć kartę o wysokiej wydajności, która, jeśli masz szczęście, może wytrzymać tak długo jako przestarzałe i aktualizujesz.

Jeśli zastanawiasz się nad zakupem używanego procesora graficznego, zdecydowanie powinieneś wziąć pod uwagę jego historię, w tym sposób, w jaki jego właściciel obchodził się z nim i używał go. Częściej używane karty (te, które działają teraz) mają większe szanse na dobre działanie w krótkim okresie, ale są bardziej podatne na niepowodzenie w dłuższej perspektywie. Nie możemy określić żywotności karty, ale intensywne użytkowanie zdecydowanie szybciej zużywa kartę graficzną.

Powodzenia!

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *