Arm Mali-G77 GPU - a teljes be- és hátrányok

Szerző: Randy Alexander
A Teremtés Dátuma: 3 Április 2021
Frissítés Dátuma: 1 Július 2024
Anonim
Arm Mali-G77 GPU - a teljes be- és hátrányok - Technológiák
Arm Mali-G77 GPU - a teljes be- és hátrányok - Technológiák

Tartalom


Az új Cortex-A77 CPU mag mellett a Arm bemutatta a következő generációs GPU-t, amelyet a következő generációs okostelefon SoC-k számára szántak. A Mali-G77 nem tévesztendő össze az új Mali-D77 kijelző processzorral, jelezve a Arm Bifrost építészetének indulását és az átállást Valhallba.

Egy pillanat alatt belemerülünk az új építészet finom részleteibe. Először is jobbra lépünk abban, amit a felhasználóknak elvárniuk kell a teljesítménynövekedés szempontjából.

A Mali-G77 teljesítmény áttekintése

A Arm akár 40% -os grafikus teljesítménynöveléssel büszkélkedhet a következő generációs Mali-G77 eszközökkel a mai Mali-G76 modellekhez képest. Ez a szám figyelembe veszi a folyamatot és az építészeti fejlesztéseket is. A Mali-G77 7-16 shader magból konfigurálható, és minden mag majdnem pontosan azonos méretű, mint a G76 mag. Ez azt jelenti, hogy a csúcskategóriás okostelefonok valószínűleg hasonló GPU-magszámmal jelennek meg, mint manapság - valahol az alsó tizenévesekben. Ez kézzel lehetővé teszi néhány spekulatív teljesítményértékelést a meglévő lapkakészletekkel szemben.


A népszerű Manhattan GFXBench referenciaértéket tekintve a 40 százalékos teljesítménynövekedés jelentős előnyt jelent a jelenlegi generációs hardverekkel szemben. A Qualcomm következő generációs Adreno chipjéhez saját jelentős teljesítmény-frissítésre lesz szüksége a versenyfeltételek szintjének fenntartásához. Úgy tűnik, hogy a táblák Arm kedvéért fordulnak.

Építészet szerint a játékteljesítmény 20–40% -kal növekszik, míg a gépi tanulás 60% -kal növeli

Ennek a meglehetősen durva golyóstílusnak a alapján egy 10-magos Mali-G77 (ezt a konfigurációt gyakran látjuk a Huawei-től) úgy néz ki, hogy majdnem kiemelkedik ezen generáció csúcstechnológiájú mobil grafikus hardverei. A 12 magos konfiguráció, amelyet általában a Samsung Exynos lát el, nagy előnyt jelent a Arm legújabb GPU-jának. A valós referenciaértékek természetesen más tényezőktől is függnek, beleértve a folyamatcsomót, a GPU gyorsítótár-memóriát, az LPDDR-memória konfigurációját és a tesztelt alkalmazás típusát. Tehát vegye be a fenti diagramot izmos adag sóval.


Ami az új architektúrát illeti, a Arm állítja, hogy a Mali-G77 átlagosan 30% -kal javítja az energiahatékonyságot és a teljesítmény-sűrűséget. Az INT8 dot terméktámogatásnak köszönhetően óriási 60% -os növekedést jelent a gépi tanulási alkalmazások. A játékteljesítményre vonatkozó elvárások 20 és 40 százalékos növekedés között vannak, a címetől és a kínált grafikai munkaterhelés típusától függően.

Annak pontos megértése érdekében, hogy Arm miként érte el ezt a teljesítmény-felemelkedést, mélyebben belemerülünk az építészetbe.

Találkozzon Valhallmal, a Bifrost utódjával

A Vahall a Arm második generációs skalar GPU architektúrája. Ez egy 16 széles láncfűtésű végrehajtó motor, amely lényegében azt jelenti, hogy a GPU 16 utasítást hajt végre párhuzamosan ciklusonként, feldolgozóegységenként és magonként. Ez 4-től 8-ig terjed a Bifrostban.

További új építészeti jellemzők közé tartozik a dinamikus utasítások ütemezése, amelyet teljes egészében hardveresen kezelnek, és egy teljesen új utasításkészlet, amely megőrzi a Bifrost operációs egyenértékét. Mások támogatják a Arm's AFBC1.3 tömörítési formátumát, az FP16 megjelenítési célokat, rétegelt megjelenítést és a csúcs shader kimeneteit.

A Mali-G77 33% -kal több matematikát végez párhuzamosan, mint a G76.

A fő építészeti változások megértésének kulcsait a magban lévő végrehajtó egység megvizsgálásával találják meg. A GPU ez a része felelős a számok riadásáért.

A végrehajtó motoron belül

A Bifrostban minden GPU-mag három végrehajtó motort tartalmazott, vagy néhány alacsonyabb végű Mali-G52 kivitel esetén kettőt. Minden motor tartalmaz egy i-gyorsítótárat, regisztrációs fájlt és egy láncvezérlő egységet. A Mali-G72-ben mindegyik motor ciklusonként 4 utasítást kezel, amely 8-ra növekedett a tavalyi Mali-G76-ban. E három magon átterjedve ciklusonként 12 és 24 32 bites lebegőpontos (FP32) olvasztott multiplikáció-felhalmozási (FMA) utasításokat adhat meg.

A Valhall és a Mali-G77 segítségével mindössze egyetlen végrehajtó motor van a GPU magjában. Mint korábban, ez a motor tartalmazza a láncvezérlő egységet, a regisztrációt és az jégcsempet, amelyet most két feldolgozó egység oszt meg. Mindegyik feldolgozó egység ciklusonként 16 vetítési utasítást kezeli, magonként 32 FP32 FMA utasítás átvitelével. Ez 33% -os növekedést jelent a Mali-G76-on keresztüli utasítások átvitelénél.

Az Arm átalakult háromról egy-egy végrehajtó egységre GPU-magonként, de most két feldolgozó egység van egy G77-magon belül.

Ezen felül ezek a feldolgozó egységek két új matematikai függvényt tartalmaznak. Az új konvertáló egység (CVT) kezeli az egész számot, a logikát, az ágot és a konvertálási utasításokat. A speciális funkcióegység (SFU) felgyorsítja az egész szám szorzását, osztását, négyzetgyökét, logaritmusokat és más komplex egész számfunkciókat.

A szokásos FMA egység látott néhány csípést, támogatva ciklusonként 16 FP32 utasítást, 32 FP16 vagy 64 INT8 pont termék utasítást. Ezek az optimalizációk 60% -os teljesítménynövekedést eredményeznek a gépi tanulási alkalmazásokban.

A Quad Texture Mapper

A Mali-G77 másik kulcsfontosságú változása a quad textúraleképező bevezetése, az előző generáció kettős textúraleképezőjével összehasonlítva. A textúraleképező felelős a jelenet 3D sokszögeinek a képernyőn látható 2D-es ábrázolásba való hozzárendeléséért. A felelős a mintavételért, az interpolációért és a szűrésért, hogy kiegyenlítsék a szögelt és mozgó tartalmat, hogy elkerüljék a durva, rossz minőségű éleket.

Az olcsó anti-aliasing továbbra is helyben van a képminőség javítása érdekében, de itt a legnagyobb előnye a textúra teljesítményének megduplázódása. A textúraegység most négy bilineáris textelt dolgoz fel óránként, szemben a korábbi 2-vel, 2 trilineáris texel / óra, és kezeli a gyorsabb FP16 és FP32 szűrést.

A négyes textúrájú térképező két részre oszlik, és rövidebb csővezetéket biztosít azoknak a szálaknak, amelyek a gyorsítótár tartalmát elérik. A hiányzó elérési út, amely kezeli a formátum-átalakítást és a textúra dekompressziót, szélesebb felületet kínál az L2 gyorsítótárhoz. Ez akkor is hasznos, ha gépi tanulási terhelést igényel, amelyre gyakran szükség lehet új adatok begyűjtésére a memóriából.

Mindent összehozva a Mali-G77-ben

Arm számos további csípést tett a Mali-G77-en, hogy egybeesjen a Valhall-építészet jelentős változásaival. A vezérlőblokk egyszerűsödik az egyedüli végrehajtó egység kialakításának köszönhetően, míg a belső dinamikus ütemező valójában rugalmasabb utasításokat ad ki az egyes magokon belül. Az egyes magokban nagyobb átviteli sebességgel az adatút rövidebb és alacsonyabb késleltetési idővel rendelkezik, mindössze 4-ciklusra a korábbi 8-ból.

Az új kialakítás jobban igazodik a Vulkan API-hoz is, egyszerűsítve a meghajtó leíróit az illesztőprogram fölött, hogy javuljon a „fém” teljesítmény.

Összefoglalva: a Mali-G72 és a Valhall fontos változtatásokat hajt végre a Bifrosthoz képest, amelyek jelentős teljesítménynövekedést ígérnek a játék- és gépi tanulási alkalmazásokban. Fontos szempont, hogy a kialakítás ugyanolyan energia- és területköltségekbe illeszkedik, mint a Bifrost, biztosítva ezzel, hogy a mobil eszközök nagyobb teljesítményt nyújthassanak anélkül, hogy aggódnának a hő-, energia- és szilíciumköltségek miatt. A teljesítmény-előrejelzések alapján a Mali-G77-nek képesnek kell lennie adnia a Qualcomm következő generációjának, Adrenónak a pénzét.

Mit cinálz, amikor utat kereel? javíta a programozái hatékonyágot? Ha Ön Google, akkor aját nyelvét fejlezti ki, amelyet gyakran Golang-nek hívnak. Ezt a t...

A Twitter felhaználó @leftoblique közzétette a fenti fényképet egy Halloween Google temetőről, amely a Google eattle-i campu irodáját dízíti. Minden &...

Népszerű Bejegyzések