To plotka dnia o kolejnych kartach Nvidii. Te nowe przecieki pochodzą z Kopte7kimi i mówią o schemacie blokowym zielonej architektury nowej generacji. Schemat blokowy GPU AD102 „Ada Lovelace” pozwoli nam przewidzieć wydajność następnego RTX 40.
RTX 40: imponujące specyfikacje (jeśli są prawdziwe)
Po pierwsze, procesor graficzny Ada Lovelace AD102 będzie miał do 12 GPC (klastrów przetwarzania grafiki). To o 70% więcej niż GA102 (największy w obecnym zakresie), który ma tylko 7 GPC. Każdy GPU będzie składał się z 6 TPC i 2 SM, pasujących do konfiguracji istniejącego układu. Każdy SM (multiprocesor strumieniowy) będzie zawierał cztery podrdzeni, co odpowiada również procesorowi graficznemu GA102. Prawdziwą zmianą jest konfiguracja rdzenia FP32 i INT32. Każdy subrdzeń będzie składał się ze 128 bloków FP32, ale połączone bloki FP32 + INT32 będą składać się z maksymalnie 192. Dzieje się tak, ponieważ bloki FP32 nie dzielą tego samego podrdzenia co bloki IN32. 128 rdzeni FP32 jest oddzielonych od 64 rdzeni INT32.
Jeden ze schematycznych obrazów GPU RTX 40 autorstwa Kopte7kimi.
Pamięć podręczna powinna być kolejnym obszarem, w którym NVIDIA poszła na całość w porównaniu z istniejącymi procesorami graficznymi Ampere. Procesory graficzne Ada Lovelace będą zawierać 192 KB pamięci podręcznej L1 na SM, o 50% więcej niż Ampere. Daje to łącznie 4,5 MB pamięci podręcznej L1 na najwyższej klasy GPU AD102. Pamięć podręczna L2 zostanie zwiększona do 96 MB, o czym regularnie wspomina się w kilku przeciekach. To prawie 16 razy więcej niż procesor graficzny Ampere, który ma tylko 6 MB pamięci podręcznej L2. Pamięć podręczna będzie współdzielona przez GPU.
Jeśli przecieki są prawidłowe, mamy wykładniczy wzrost pamięci podręcznej L2 do 96 MB dla AD102. Jeśli chodzi o ROP, mielibyśmy dwa razy więcej bloków na tej architekturze, dokładnie 32 na GPC, co dałoby nam łącznie 384 ROP dla możliwego RTX 4090 w porównaniu do 112 dla RTX 3090… Na papierze jest to potworne .
Porównanie charakterystyk GPU. AD102 będzie szczytowym osiągnięciem w ofercie RTX 40.
Ale po tej orgii danych technicznych, jakich korzyści możemy się spodziewać?
Oczywiście jest jeszcze za wcześnie na dokładny pomysł, ale jeśli te elementy się potwierdzą, karta techniczna pokaże ogromną różnicę w porównaniu do Ampere. Podsumowując :
- X2 GPC (w porównaniu z Amperami)
- 50% więcej rdzeni (w porównaniu do Ampere)
- 50% więcej pamięci podręcznej L1 (w porównaniu do Ampere)
- Pamięć podręczna 16x L2 (w porównaniu do Ampere)
- X2 ROP (w porównaniu do Amper)
- Rdzenie tensorowe czwartej generacji i rdzenie RT trzeciej generacji
Ale czego możemy się spodziewać, jeśli chodzi o rzeczywistą wydajność?
Jest to bardzo trudne, ponieważ brakuje nam kluczowego elementu danych: częstotliwości pracy.
Zastanawiając się trochę, możemy zaprojektować moc FP32 na 90 TFLOPS, czyli ponad dwukrotnie więcej niż w obecnym GA102. Jednak w przypadku TFLOPS możemy mieć również niespodzianki. Jeśli dają wyobrażenie o surowej wydajności, nigdy nie pozwalają na stronniczą ocenę wyników w „codziennym” użyciu. Wyciekły zapowiedzi x2 na x2.2 w porównaniu do RTX 30… Wzrost będzie wyraźnie, wydaje się znaczący. Ale żeby decydować dalej, będziemy musieli trochę poczekać.
Dodaj komentarz