Kar Cortex-A77 - minden, amit tudnod kell

Szerző: Randy Alexander
A Teremtés Dátuma: 2 Április 2021
Frissítés Dátuma: 1 Július 2024
Anonim
Kar Cortex-A77 - minden, amit tudnod kell - Technológiák
Kar Cortex-A77 - minden, amit tudnod kell - Technológiák

Tartalom


Az új Mali-G77 grafikus processzorral és a Mali-D77 kijelző processzorral együtt a Arm bemutatta legújabb nagyteljesítményű CPU kialakítását - a Cortex-A77-et. A tavalyi Cortex-A76-hoz hasonlóan, a Cortex-A77-et prémium szintű alkalmazásokhoz tervezték, amelyek megkövetelik az Arm aláírása alacsony energiafelhasználását. Mindent az okostelefonoktól a laptopokig és valószínűleg azon túl is.

A Cortex-A77-vel a Arm megcélozta a ciklusonkénti / óra (IPC) teljesítménynövekedés maximális utasításait, amelyeket a Cortex-A76-on képes kezelni. Az órafrekvenciákat, az energiafogyasztást és a területet úgy tervezték, hogy nagyjából ugyanabban a gördülőparkban maradjanak, de az új mag egyszerre több utasítás útján összeroppant. Ennek érdekében a Arm egy még szélesebb magot tervezett, mint tavaly, és számos fejlesztést tett annak érdekében, hogy a CPU-magot táplálja a tennivalók. De mielőtt erre eljutunk, merüljünk bele a magas szintű áttekintésbe és a teljesítményszámba.


Ütési teljesítménycélok

2018 augusztusában a Arm szokatlanul megosztotta a CPU ütemtervét a 2020-ig. A 2016-os Cortex-A73-tól a 2020-as „Hercules” tervezéséig a vállalat 2,5-szeresére növeli a számítástechnika teljesítményét. Ennek a hatalmas vetületnek a méltányos darabja a Cortex-A76-os mikroarchitektúra nagy változásával, a modern modern órasebességgel, valamint a 16-ról 10-re és most 7 nm-re történő gyártással 5 nm-rel haladt. Az ütemterv nyereségének körülbelül 1,8-szorosát már tavaly elérték, és a Cortex-A77 kb. 20% -kal tovább növeli az IPC-t. Ez jó úton jár a Arm 2,5x-es célkitűzéséhez, bár a korlátozott energia- és hőigényű mobil eszközök nem várják el mindezen előnyök elérését.


Összehasonlításképpen: a tavalyi Cortex-A76 kb. 30-35 százalékos növekedést nyújtott a Cortex-A75-hez képest. Idén egy némább, de még mindig jelentős 20% -os IPC-nyereséget vizsgálunk az A77 és A76 között. Ez jó hír, mert nagyobb teljesítményt jelent, miközben megtartja a korábbi hasonló hő- és teljesítménykorlátozásokat. A kompromisszum az, hogy az A77 körülbelül 17 százalékkal nagyobb, mint az A76, tehát valamivel többet kell fizetnie a szilícium területét tekintve. Ha összehasonlítani szeretne az asztali vezetőkkel, akkor az AMD 15% -kal növelte az IPC növekedését a Zen2 és a Zen + között, míg az Intel IPC-je évekig gyakorlatilag statikus maradt.Természetesen itt különféle piaci szegmensekről beszélünk, de ez azt mutatja, hogy a Arm CPU tervező csapata milyen látványos haszonnal jár az utóbbi generációk során.

20% -os teljesítménynövelést kínálnak a következő generációs Cortex-A77 alapú SoC-k

Itt van az elfogadom, hogy az A76 jelentős mikroarhitektikai változást jelentett hatalmas teljesítménynövekedéssel, miközben visszatértünk az A77-es optimalizációs szint javulására. Ezzel az útból merüljünk bele az Arm Cortex-A77 újdonságaiba.

A Cortex-A77 az A76 mikroarchitektúrára épül

A Cortex-A77 és az A76 közötti különbség megértésének kulcsa az, hogy megragadjuk, mit jelent a „szélesebb” alapterv. Alapvetően arról beszélünk, hogy minden egyes órajel-cikluson belül további utasításokat hajthatunk végre, ami növeli a mag teljesítményét. Két fontos rész van ennek a jognak a megszerzésében - a végrehajtáshoz szükséges egységek számának növelése a feldolgozáshoz, valamint annak biztosítása, hogy ezeket az egységeket az adatokkal jól ellátják. Kezdjük az utóbbi résszel, és összpontosítsunk a SoC diszpécserére, gyorsítótárára és elágazói előrejelző részeire.

A Cortex-A77 50% -kal növeli a feladási szélességet, ciklusonként akár hat utasítást adhat az A76-ból négynél. Ez azt jelenti, hogy minden egyes óraciklusra vonatkozóan több utasítást kell végrehajtani a végrehajtási maghoz a nagyobb teljesítmény potenciál érdekében. Ennek eredményeként a megrendelésen kívüli végrehajtási ablak szintén nagyobb, 160 bejegyzésre növekedve, hogy még több párhuzamosságot lehessen felfedni. Van egy ismerős 64K utasítás-gyorsítótár, míg a Branch Target Buffer (BTB), amely az ág-előrejelző címeit tárolja, 33 százalékkal nagyobb, mint korábban, hogy a növekedést párhuzamos utasításokkal kezelje. Semmi szokatlan itt, ez lényegében a tavalyi tervezés szélesebb verziója.

A még érdekesebb front-end kiegészítés a vadonatúj 1,5K-os MOP-gyorsítótár, amely tárolja a dekódolóegységből visszatérő makro-Ops (MOP-okat). Az Arm CPU architektúrája dekódolja a felhasználói alkalmazás utasításait kisebb makroműveletekbe, majd tovább a mikro-opciókba, amelyeket a végrehajtási mag megért. Ezt a fenti ábrán láthatja, a dekódolás szakaszban. A MOP gyorsítótárat arra használják, hogy csökkentsék az elmulasztott ágak és öblítések költségbüntetését, mivel megtartják a makroopciókat, ahelyett, hogy újra dekódolnák őket, és növelik a mag teljes teljesítményét. Az i-gyorsítótár helyett a MOP-ból történő letöltések megkerülik a dekódolási szakaszt, megtakarítva egy ciklust. Arm állítja, hogy a MOP-gyorsítótár elérheti a 85% -ot vagy annál nagyobb találati arányt számos munkaterhelésnél, így nagyon hasznos kiegészítést jelent a szokásos i-gyorsítótárhoz.

Ha a CPU végrehajtási központi részébe lép, vegye figyelembe egy negyedik ALU és egy második Branch egység hozzáadását. Ez a negyedik ALU 50% -kal növeli a processzor általános számának a sávszélességet. Ez a kiegészítő ALU képes alapvető egyciklusú utasításokra (például ADD és SUB), plusz kétciklusos egész műveletekre, ilyen szorzásra. A többi ALU közül kettő csak az alapvető egyciklusú utasításokat tudja kezelni, míg a végső egységet fejlettebb matematikai műveletekkel töltik fel, mint például osztás, szorzás-felhalmozás stb. A végrehajtási magban lévő második ág egység megkétszerezi az egyidejű ágok számát. a mag képes kezelni, ami akkor hasznos, ha a hat elküldött utasításból kettő az águgrás. Ez kissé furcsanak hangzik, de a Arm belső tesztelése felfedte a teljesítmény előnyeit, ha ezt a második egységet átveszik.

A Cortex-A77 továbbfejlesztett párhuzamosságot és új beolvasást kínál az előre letöltött gyorsítótárakra

A CPU-mag további megismétlései között szerepel egy második AES titkosítási csővezeték hozzáadása. Az adattároló csővezetékek mostantól dedikált kiadási portokat tartalmaznak a memóriakibocsátás sávszélességének megduplázására. Ezeket a portokat korábban megosztották az ALU-kkal, amelyek néha szűk keresztmetszetté válhatnak. Van egy következő generációs adatfejlesztő is, amely javítja az energiahatékonyságot, miközben növeli a DRAM rendszer sávszélességét.

A Cortex-A77 rendszerének ezen része egy teljesen új, “rendszertudatos” prefetch rendszert is tartalmaz. Ez javítja a memória teljesítményét a CPU mag számának széles köre, a gyorsítótár kapacitása és késése, valamint a memória alrendszer konfigurációi alapján a végső eszközökön. A dedikált hardver a Dynamic Scheduling Unit (DSU) -nel való beszélgetéshez egy DynamIQ CPU-fürt részeként, amely figyelemmel kíséri a megosztott L3 gyorsítótár használatát. A mag jellemzői: dinamikus távolság és agresszivitás, amelyek csökkentik a gyorsítótár kihasználását olyan helyzetekben, amikor az L3 sávszélességét más CPU-mag korlátozza. A nagyobb teljesítményű magok, mint például a Cortex-A77, valószínűleg telítik a DSU memória elérését, míg az alacsonyabb teljesítményű magok, mint például az A55, valószínűtlenül.

Mindent összeillesztve

A Cortex-A77-ben sok apró változás történt, amelyek elődjéhez képest jelentős különbségeket eredményeznek. Dióhéjban az A77s új MOP gyorsítótára egy szélesebb és hosszabb utasításablakkal kombinálva segíti a feltöltött ALU, Branch és memóriaegységek elfoglalását a tennivalókkal. A Cortex-A76 erőmű építését továbbfejlesztették, hogy tovább javítsák teljesítményét az A77-rel, anélkül, hogy a magasabb órasebességre támaszkodnának.

A legnagyobb teljesítmény a Cortex-A77-hez egész szám és lebegőpontos matematika formájában érkezik. Ezt megerősíti a Arm belső referenciaértékei, amelyek 20–35 százalékos teljesítménynövekedést mutatnak az SPEC egész számok és a lebegőpontos referenciaértékek esetében. A memória sávszélességének javulása valahol 15 és 20 százalék között mozog, ismét kiemelve, hogy a legnagyobb nyereség a számcsökkentés formájában jelentkezik. Összességében ezek a fejlesztések az A77-hez átlagosan 20% -kal megemelkednek az előző generációhoz képest. Láthatunk még további, marginálisabb előnyöket is a fejlettebb 7 nm-es gyártási folyamatok eredményeként az év későbbi szakaszában vagy 2020 elején.

Az okostelefonok szempontjából a Cortex-A77 motorral ellátott SoC-k nagy teljesítményű zászlóshajó termékekhez készültek. A Arm teljes mértékben azt várja, hogy az erőmű kialakítása 4 + 4 bit-et használjon. Figyelembe véve az A77 megnövekedett átviteli sebességét és az A77 terület méretének enyhe kibomlását, valószínűleg látni fogjuk, hogy a SoC tervezői folytatják az 1 + 3 + 4 vagy a 2 + 2 + 4 tendenciát. Egy vagy két nagyméretű, nagyobb gyorsítótárakkal és magasabb órákkal ellátott nagy maggal, 2 vagy 3 A77-es maggal, kisebb gyorsítótár-méretű és alacsonyabb órákkal kiegészítve, hogy energiát és területet takarítson meg. Végül a Cortex-A77 jó dolgokat mond az okostelefon-chipekre és a mindig csatlakoztatott Arm alapú laptopok növekvő piacára. Figyelemmel kísérje a szilícium bejelentéseket az év későbbi szakaszában.

Az éjzakai üzemmódok ma a kamera egyik legfontoabb funkciójává váltak, több képet é má feldolgozái technikákat kombinálva a jobb g...

A OnePlu táralapítója é vezérigazgatója, Pete Lau megerőítette, hogy a OnePlu 7 Pro már működik, é megvitatta annak néhány jellemzőjét....

Új Hozzászólások