Karta graficzna Arm Mali-G77 - kompletne wejścia i wyjścia

Autor: Randy Alexander
Data Utworzenia: 3 Kwiecień 2021
Data Aktualizacji: 1 Lipiec 2024
Anonim
Arm Mali GPU Training Series Ep 1.1 : Introduction to mobile systems
Wideo: Arm Mali GPU Training Series Ep 1.1 : Introduction to mobile systems

Zawartość


Wraz z nowym rdzeniem procesora Cortex-A77, Arm zaprezentował procesor graficzny nowej generacji przeznaczony do SoCs smartfonów nowej generacji. Mali-G77, którego nie należy mylić z nowym procesorem wyświetlania Mali-D77, oznacza odejście od architektury Bifrost firmy Arm i przejście do Valhall.

Za chwilę zajmiemy się szczegółami nowej architektury. Po pierwsze, przejdziemy do tego, czego użytkownicy powinni się spodziewać pod względem wzrostu wydajności.

Przegląd wydajności Mali-G77

Arm oferuje nawet 40-procentowy wzrost wydajności grafiki dzięki urządzeniom Mali-G77 nowej generacji w porównaniu z dzisiejszymi modelami Mali-G76. Liczba ta uwzględnia zarówno proces, jak i ulepszenia architektoniczne. Mali-G77 można konfigurować od 7 do 16 rdzeni cieniujących, a każdy rdzeń ma prawie dokładnie taki sam rozmiar jak rdzeń G76. Oznacza to, że smartfony z wyższej półki prawdopodobnie będą sprzedawane z podobną liczbą rdzeni GPU, jak mają to miejsce obecnie - gdzieś u młodszych nastolatków. Dzięki temu możemy dokonać spekulacyjnych ocen wydajności w stosunku do istniejących chipsetów.


Patrząc na popularny test porównawczy Manhattan GFXBench, 40-procentowy wzrost wydajności otwiera znaczną przewagę nad sprzętem obecnej generacji. Chip Adreno nowej generacji Qualcomm będzie wymagał znacznego ulepszenia wydajności, aby utrzymać równe szanse. Stoły wydają się obracać na korzyść Arm.

Pod względem architektury wydajność gier wzrasta o 20 do 40%, podczas gdy uczenie maszynowe zyskuje 60%

W oparciu o ten dość prymitywny ballparking, 10-rdzeniowy Mali-G77 (konfiguracja, którą często widzimy z Huawei) ma na celu wyłonić najnowocześniejszy sprzęt mobilny tej generacji. 12-rdzeniowa konfiguracja, zwykle spotykana w Samsung Exynos, zapewnia dużą przewagę dla najnowszego procesora graficznego Arm. Oczywiście rzeczywiste testy porównawcze będą zależeć od innych czynników, w tym od węzła procesu, pamięci podręcznej GPU, konfiguracji pamięci LPDDR i rodzaju testowanej aplikacji. Więc weź powyższy wykres z dużą dawką soli.

Jeśli chodzi o samą nową architekturę, Arm stwierdza, że ​​Mali-G77 oferuje uśrednioną 30-procentową poprawę efektywności energetycznej i gęstości wydajności. Istnieje również ogromny 60-procentowy wzrost w aplikacjach uczenia maszynowego, dzięki obsłudze produktu INT8 dot. Oczekiwania dotyczące wydajności gier wynoszą od 20 do 40 procent wzrostu, w zależności od tytułu i rodzaju obciążeń graficznych w ofercie.


Aby dokładnie zrozumieć, w jaki sposób Arm osiągnął ten wzrost wydajności, przyjrzyjmy się bliżej architekturze.

Poznaj Valhall, następcę Bifrosta

Vahall to skalarna architektura GPU drugiej generacji firmy Arm. Jest to 16-zakresowy silnik wykonawczy osnowy, co w zasadzie oznacza, że ​​GPU wykonuje równolegle 16 instrukcji na cykl, na jednostkę przetwarzającą, na rdzeń. To więcej niż 4 i 8 w Bifrost.

Inne nowe funkcje architektoniczne obejmują dynamiczne planowanie instrukcji zarządzane całkowicie sprzętowo oraz zupełnie nowy zestaw instrukcji, który zachowuje równoważność operacyjną z Bifrost. Inne obejmują obsługę formatu kompresji AFBC1.3 firmy Arm, celów renderowania FP16, renderowania warstwowego i wyników cieniowania wierzchołków.

Mali-G77 wykonuje 33% więcej matematyki równolegle niż G76.

Klucze do zrozumienia głównych zmian architektonicznych można znaleźć, badając jednostkę wykonawczą wewnątrz rdzenia. Ta część procesora graficznego jest odpowiedzialna za dzielenie numerów.

Wewnątrz silnika wykonawczego

W Bifrost każdy rdzeń GPU zawierał trzy silniki wykonawcze lub dwa w przypadku niektórych niższych modeli Mali-G52. Każdy silnik zawiera pamięć podręczną i-cache, plik rejestru i jednostkę sterującą wypaczaniem. W Mali-G72 każdy silnik obsługuje 4 instrukcje na cykl, które wzrosły do ​​8 w zeszłym roku Mali-G76. Rozłożony na te trzy rdzenie pozwala na 12 i 24 32-bitowe instrukcje zmiennoprzecinkowe (FP32) z wielokrotnym akumulowaniem (FMA) na cykl.

W przypadku Valhall i Mali-G77 w każdym rdzeniu GPU znajduje się tylko jeden silnik wykonawczy. Tak jak poprzednio, w tym silniku znajduje się jednostka sterująca osnowy, rejestr i icache, które są teraz współużytkowane przez dwie jednostki przetwarzania. Każda jednostka przetwarzająca obsługuje 16 instrukcji osnowy na cykl, co daje łączną przepustowość 32 instrukcji FMA FP32 na rdzeń. To 33-procentowy wzrost przepustowości instrukcji w porównaniu z Mali-G76.

Uzbrojenie zmieniło się z trzech na jedną jednostkę wykonawczą na rdzeń GPU, ale obecnie w rdzeniu G77 znajdują się dwie jednostki przetwarzające.

Ponadto każda z tych jednostek przetwarzania zawiera dwa nowe bloki funkcji matematycznych. Nowa jednostka konwersji (CVT) obsługuje podstawowe instrukcje dotyczące liczb całkowitych, logiki, rozgałęzienia i konwersji. Specjalna jednostka funkcyjna (SFU) przyspiesza mnożenie liczb całkowitych, podziałów, pierwiastków kwadratowych, logarytmów i innych złożonych funkcji liczb całkowitych.

Standardowa jednostka FMA odnotowała kilka poprawek, obsługując 16 instrukcji FP32 na cykl, 32 instrukcje FP16 lub 64 instrukcje INT INT. Te optymalizacje powodują 60-procentowy wzrost wydajności w aplikacjach uczenia maszynowego.

Maper tekstur Quad

Inną kluczową zmianą w Mali-G77 jest wprowadzenie poczwórnego mapera tekstur, w porównaniu z podwójnym maperem tekstur w poprzedniej generacji. Maper tekstur jest odpowiedzialny za mapowanie wielokątów 3D w scenie do reprezentacji 2D widocznej na ekranie. Odpowiada za próbkowanie, interpolację i filtrowanie w celu wygładzenia pod kątem i ruchomych treści, aby uniknąć ostrych krawędzi niskiej jakości.

Tani anty-aliasing pozostaje na miejscu, aby poprawić jakość obrazu, ale podwojenie wydajności tekstur jest tutaj główną korzyścią. Jednostka tekstur przetwarza teraz 4 dwuliniowe tekstury na zegar w porównaniu z 2 poprzednimi, 2 trójliniowe tekstury na zegar i obsługuje szybsze filtrowanie FP16 i FP32.

Czteroczęściowy maper tekstur jest podzielony na dwie ścieżki, co zapewnia krótszy potok dla wątków trafiających do zawartości pamięci podręcznej. Ścieżka braków, która obsługuje konwersję formatu i dekompresję tekstur, ma szerszy interfejs do pamięci podręcznej L2. Jest to również pomocne w przypadku obciążeń związanych z uczeniem maszynowym, które często wymagają pobierania nowych danych z pamięci.

Łącząc wszystko w Mali-G77

Arm dokonał szeregu innych poprawek w Mali-G77, aby zbiegły się z głównymi zmianami w architekturze Valhall. Blok sterowania jest uproszczony dzięki konstrukcji pojedynczej jednostki wykonawczej, podczas gdy wewnętrzny harmonogram dynamiczny pozwala na bardziej elastyczne wydawanie instrukcji wewnątrz każdego rdzenia. Dzięki wyższej przepustowości w każdym rdzeniu ścieżka danych jest również krótsza i ma mniejsze opóźnienia, do zaledwie 4 cykli z 8 poprzednio.

Nowy projekt jest również lepiej dostosowany do interfejsu API Vulkan, upraszczając deskryptory sterowników, aby obniżyć koszty ogólne sterowników w celu poprawy wydajności „do metalu”.

Podsumowując, Mali-G72 i Valhall wprowadzają ważne zmiany w stosunku do Bifrost, które obiecują znaczne zwiększenie wydajności w grach i aplikacjach uczenia maszynowego. Co ważne, konstrukcja mieści się w tych samych budżetach mocy i powierzchni, co Bifrost, zapewniając, że urządzenia mobilne będą w stanie zaoferować większą wydajność szczytową bez obawy o koszty ciepła, energii i krzemu. W oparciu o prognozy wydajności, Mali-G77 powinien być w stanie zapewnić nowej generacji Qualcomm Adreno dobrą passę za swoje pieniądze.

Jeśli zdarzyło ci ię być w pociągu ICE 1125 do Monachium w Niemczech, który odjechał 22 kwietnia o 6:06 CET, być może złapałeś martfona, który wypadł z czyjegoś plecaka. Jeśli tak, to maz pr...

Debiut prawdziwych bezprzewodowych łuchawek Loui Vuitton ma zotać przedany za niepełna 1000 UD.Fortuna przyja odważnym w dynamicznym świecie mody, a przynajmniej tak mi powiedziano, a niewiele rzeczy ...

Artykuły Dla Ciebie