Pascal (mikroarchitektura)

mikroarchitektura

Pascal je kódové označení pro GPU mikroarchitekturu společnosti Nvidia, která vyšla v dubnu roku 2016 jako nástupce architektury Maxwell. Byla pojmenována po francouzském matematikovi Blaisi Pascalovi.

Tato architektura je používána u spotřebitelských grafických karet GeForce série 10 a u grafických karet pro pracovní stanice, servery a superpočítače s označením Quadro a Tesla.

Architektura

Prvním vydaným čipem architektury Pascal byl GP100 používaný především v modelu Tesla, který je cílen na datová centra, velké servery a superpočítače.[1]. Následoval grafický čip GP104, který se nachází ve výkonných grafických kartách a jehož shaderové jednotky jsou více podobné těm u Maxwellu.

Mezi vylepšení architektury čipu GP100 oproti Maxwellu patří:

  • Jedna renderovací jednotka (Render Output Unit - ROP) Pascalu má 64 CUDA jader. Pro srovnání, Maxwell jich měl 128, Kepler 192, Fermi 32 a Tesla pouze 8.
  • Podpora CUDA 6.0.
  • High Bandwidth Memory 2 - některé karty mají 16 GB HBM2 s 4096bitovou datovou sběrnicí a rychlostí paměti 720 GB/s.
  • Unified memory (unifikovaná paměť) - umožňuje CPU a GPU využívat jak paměť RAM, tak paměť VRAM za pomocí technologie Page Migration Engine.
  • NVLink - datová sběrnice vysoké rychlosti pro komunikaci mezi GPU a CPU nebo mezi více GPU. NVLink umožňuje mnohem vyšší přenosovou rychlost než má SLI Bridge. Podle odhadů 80-200 GB/s. NVLink se používá pouze u profesionálních karet (Quadro, Tesla) nebo u nové "herní" generace Turing (RTX 2080 Ti atd.).[2]
  • 16bitové operace (FP16) s desetinnými čísly jsou dvakrát rychlejší než s 32bitovými čísly (FP32) a čtyřikrát rychlejší než s 64bitovými čísly (FP64).
  • Dvakrát více registrů na každé CUDA jádro než měl Maxwell.
  • Více sdílené paměti.
  • Dynamic Load Balancing Scheduling system. Umožňuje rozplánovat využití GPU pro různé operace, což umožňuje plné využití grafické karty.

Mezi vylepšení architektury čipu GP104 patří:

  • Podpora CUDA 6.1
  • GDDR5X - nový paměťový standard podporující přenos dat rychlostí 10 Gbit/s navíc s vylepšenou kontrolou paměti.
  • Simultaneous Multi-Projection - vytváření více projekcí jediného geometrického obrazu.
  • DisplayPort 1.4, HDMI 2.0b.
  • Delta Color Compression čtvrté generace.
  • Enhanced SLI Interface - zrychlení rozhraní SLI oproti předchozím verzím
  • Hardwarové dekódování HEVC Main10, Main12 a VP9.
  • NVENC Hardwarové kódování HEVC Main10.
  • Podpora HDCP 2.2 pro přehrávání DRM chráněného 4K obsahu.
  • GPU Boost 3.0.

Čipy

  • GP100 - Využíván v modelech Nvidia Tesla P100 a Quadro GP100. Je určen pro GPGPU aplikace, které často počítají s 64bitovými (a také jednoduššími) desetinnými čísly, nebo pro deep learning. Využívají HBM2 paměť.
  • GP102 - Využíván v modelech TITAN Xp, Titan X, GeForce GTX 1080 Ti, které disponují pamětí GDDR5X, a také v modelech Quadro P6000 a Tesla P40.
  • GP104 - Využíván v modelech GeForce GTX 1070 a GTX 1080. GTX 1070 má čtvrtinu shaderových jednotek deaktivovanou a na rozdíl od GTX 1080, která disponuje GDDR5X pamětí, má paměť GDDR5.
  • GP106 - Využíván v modelu GTX 1060 s pamětí GDDR5 a v modelu Quadro P2000.
  • GP107 - Využíván modely GTX 1050, GTX 1050 Ti, Quadro P1000, Quadro P600 a Quadro P400.
  • GP108 - Využíván v modelu GeForce GT 1030.

Seznam produktů GeForce série 10

Desktopové

ModelProces
(nm)
Tranzistory
(miliardy)
RozhraníPočet
CUDA jader
TaktPaměťTepelný
výkon
(W)
Základní
takt
jádra
(MHz)
Boost
takt
jádra
(MHz)
Takt
paměti
(MT/s)
Velikost
(GB)
TypŠířka
sběrnice
(bit)
GeForce
GT
1030
141,8PCIe 3.0
x4
3841227146860002GDDR56430
GeForce
GTX
1050
3,3PCIe 3.0
x16
64013541455700012875
GeForce
GTX
1050 Ti
7681290139270004
GeForce
GTX
1060 3GB
164,41152150617088000/
9000
3192120
GeForce
GTX
1060 6GB
12806
GeForce
GTX
1070
7,21920168380008256150
GeForce
GTX
1080
25601607173310000/
11000
GDDR5X180
GeForce
GTX
1080 Ti
11.83584148115821100811352250
NVIDIA
TITAN
X
141715311000812384
NVIDIA
TITAN
Xp
38401405158211408

Odkazy

Reference

Externí odkazy