GeForce 400

Servindo como a introdução do Fermi, a série GeForce 400 é uma série de unidades de processamento gráfico desenvolvidas pela Nvidia. Seu lançamento foi originalmente programado para novembro de 2009;[2] no entanto, após atrasos, foi lançado em 26 de março de 2010, com disponibilidade em abril de 2010.

NVIDIA GeForce 400
CodinomeGF10x
Lançado em12 de abril de 2010
GPU básicaGeForce GT 420, GT 430
GPU IntermediáriaGeForce GT440, GTS 450, GTX460, GTX465
GPU Topo-de-linhaGeForce GTX 470, GTX 480
Versão DirectXDirect3D 12.0 (nível de recurso 11_0)[1]
Shader Model 5.1

Seu concorrente direto era o Radeon HD 5000 Series da ATI.

As placas gráficas Geforce 400 não têm mais suporte oficial, isto é, drivers para Windows não são mais lançados com suporte a estes modelos, pela Nvidia, desde janeiro de 2019.[3]

Arquitetura

Ver artigo principal: Microarquitetura Fermi

A Nvidia descreveu a microarquitetura Fermi como o próximo grande passo em sua linha de GPUs seguindo a microarquitetura Tesla usada desde o G80. O GF100, o primeiro produto da arquitetura Fermi, é grande: 512 processadores stream, em dezesseis grupos de 32, e 3,0 bilhões de transistores, fabricados pela TSMC em um processo de 40 nm. É o primeiro chip da Nvidia a suportar OpenGL 4.0 e Direct3D 11. Nenhum produto com uma GPU GF100 totalmente habilitada foi vendido. A GTX 480 tinha um multiprocessador de streaming desativado. A GTX 470 tinha dois multiprocessadores de streaming e um controlador de memória desabilitados. A GTX 465 tinha cinco multiprocessadores de streaming e dois controladores de memória desativados. As placas GeForce de consumo vêm com 256 MB anexadas a cada um dos controladores de memória GDDR5 habilitados, para um total de 1,5, 1,25 ou 1,0 GB; o Tesla C2050 tinha 512 MB em cada um dos seis controladores e o Tesla C2070 tinha 1024 MB por controlador. Ambos os cartões Tesla tinham quatorze grupos ativos de processadores de fluxo.

Os chips encontrados na marca Tesla de alto desempenho apresentam memória com ECC opcional e a capacidade de executar uma operação de ponto flutuante de precisão dupla por ciclo por núcleo; as placas GeForce do consumidor são artificialmente restritas a uma operação DP a cada quatro ciclos. Com esses recursos, combinados com suporte para Visual Studio e C++, a Nvidia direcionou-se aos mercados profissionais e comerciais, bem como ao uso em computação de alto desempenho.

Fermi recebeu o nome do físico italiano Enrico Fermi.

Limitações atuais e trade-offs

A quantidade de SRAM on-board por ALU na verdade diminuiu proporcionalmente em comparação com a geração anterior do G200, apesar do aumento do cache L2 de 256kB por 240 ALUs para 768kB por 512 ALUs, já que o Fermi tem apenas 32.768 registradores por 32 ALUs (vs. 16384 por 8 ALUs), apenas 48kB de memória compartilhada por 32 ALUs (vs. 16kB por 8 ALUs) e apenas 16kB de cache por 32 ALUs (vs. 8kB de cache constante por 8 ALUs + 24kB de cache de textura por 24 ALUs). Parâmetros como o número de registros podem ser encontrados na tabela de comparação de capacidade de computação CUDA no manual de referência.[4]

História

Em 30 de setembro de 2009, a Nvidia lançou um white paper descrevendo a arquitetura:[5] o chip possui 16 'Streaming Multiprocessors' cada um com 32 'CUDA Cores' capazes de uma operação de precisão única por ciclo ou uma operação de precisão dupla a cada dois cycle, um espaço de endereço virtual de 40 bits que permite que a memória do host seja mapeada no espaço de endereço do chip, o que significa que há apenas um tipo de ponteiro e tornando o suporte a C++ significativamente mais fácil, e uma interface de memória GDDR5 de 384 bits. Tal como acontece com o G80 e GT200, os encadeamentos são agendados em 'warps', conjuntos de 32 encadeamentos, cada um em execução em um único núcleo de sombreador. Enquanto o GT200 tinha 16 KB de 'memória compartilhada' associada a cada cluster de shader e exigia que os dados fossem lidos através das unidades de texturização se um cache fosse necessário, o GF100 tem 64 KB de memória associada a cada cluster, que pode ser usado como um Cache de 48 KB mais 16 KB de memória compartilhada ou como um cache de 16 KB mais 48 KB de memória compartilhada, juntamente com um cache L2 de 768 KB compartilhado por todos os 16 clusters.

O white paper descreve o chip muito mais como um processador de uso geral para cargas de trabalho que abrangem dezenas de milhares de threads - reminiscente da arquitetura Tera MTA, embora sem o suporte dessa máquina para acesso aleatório à memória muito eficiente - do que como um processador gráfico.

Muitos usuários relataram altes temperaturas e consumo de energia enquanto recebiam melhorias de desempenho correspondentemente ruims nas GPUs Fermi da série GeForce 400 quando comparadas com a Radeon HD 5000 Series do concorrente rival AMD - levando a AMD a criar e lançar um vídeo promocional "The Misunderstanding"[6] para cutucar diversão na questão. No vídeo, uma unidade policial é vista iniciando uma batida em uma casa com um grande perfil térmico, indicando uma operação de cultivo. No entanto, ao entrar na casa, fica claro que a fonte da alta temperatura é uma GPU Fermi.[7][8] Tornou-se uma piada comum que alguém poderia fritar um ovo em uma GPU Fermi em plena carga.[9]

Produtos

  • 1 SPs - Processadores de Shader - Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização
  • 2 Cada Streaming Multiprocessor (SM) na GPU da arquitetura GF100 contém 32 SPs e 4 SFUs. Cada Streaming Multiprocessor (SM) na GPU da arquitetura GF104/106/108 contém 48 SPs e 8 SFUs. Cada SP pode atender a 2 operações de adição e multiplicação fundidas de precisão única (FMA) por ciclo. Cada SFU pode cumprir quatro operações SF por ciclo. Uma operação FMA conta para duas operações de ponto flutuante. Portanto, o desempenho teórico de pico de precisão única, com contagem de shader [n] e frequência de shader [f, GHz], pode ser estimado pelo seguinte, FLOPSsp ≈ f × n × 2 (FMA). Potência de processamento total: para GF100 FLOPSsp ≈ f × m ×(32 SPs × 2(FMA) + 4 × 4 SFUs) e para GF104/106/108 FLOPSsp ≈ f × m × (48 SPs × 2(FMA) + 4 × 8 SFUs) ou para GF100 FLOPSsp ≈ f × n × 2.5 e para GF104/106/108 FLOPSsp ≈ f × n × 8 / 3.[10]

SP - Shader Processor (Unified Shader, CUDA Core), SFU - Special Function Unit, SM - Streaming Multiprocessor.

  • 3 Cada SM no GF100 contém 4 unidades de filtragem de textura para cada unidade de endereço de textura. A matriz GF100 completa contém 64 unidades de endereço de textura e 256 unidades de filtragem de textura.[11] Cada SM na arquitetura GF104/106/108 contém 8 unidades de filtragem de textura para cada unidade de endereço de textura. A matriz GF104 completa contém 64 unidades de endereço de textura e 512 unidades de filtragem de textura, a matriz GF106 completa contém 32 unidades de endereço de textura e 256 unidades de filtragem de textura e a matriz GF108 completa contém 16 unidades de endereço de textura e 128 unidades de filtragem de textura.[12]

Todos os produtos são produzidos em um processo de fabricação de 40 nm. Todos os produtos suportam Direct3D 12.0 em um nível de recurso 11_0, OpenGL 4.6 e OpenCL 1.1. A única exceção é a GeForce 405, uma placa somente OEM, que é baseada no núcleo GT218 (Tesla) suportando apenas DirectX 10.1, OpenGL 3.3 e sem suporte a OpenCL, e é a única placa da linha GeForce 400 não baseada no Microarquitetura de Fermi. Pelos parâmetros, a GeForce 405 é idêntica à GeForce 310, também uma placa somente OEM, que é baseada na GeForce 210. Todos os produtos têm um único conector DB15 VGA em uma placa de altura e comprimento total, exceto conforme listado em contrário.

Em 8 de novembro de 2010, a Nvidia lançou o chip GF110, junto com o GTX 580 (substituto do 480). É um chip GF100 redesenhado, que usa significativamente menos energia. Isso permitiu que a Nvidia habilitasse todos os 16 SMs (todos os 16 núcleos), o que antes era impossível no GF100. Vários recursos da arquitetura GF100 estavam disponíveis apenas nas séries de placas Quadro e Tesla, mais caras.[13] Para os produtos de consumo GeForce, o desempenho de precisão dupla é um quarto do desempenho da arquitetura Fermi "completa". A verificação e correção de erros de memória (ECC) também não funciona em cartões de consumo.[14] As placas GF100 fornecem Compute Capability 2.0, enquanto as placas GF104/106/108 fornecem Compute Capability 2.1.

Tabela de chipsets

ModeloLançamentoNome do códigoFab (nm)Transistores (Milhões)Tamanho da matriz (mm2)contagem de SMCore config[a][b]taxa de clockTaxa de preenchimentoConfiguração de memóriaSuporte API (versão)Poder de processamento (GFLOPS)[c]TDP (Watts)[d]Preço de lançamento (USD)
Core (MHz)Shader (MHz)Memória (MHz)Pixel (GP/s)Textura (GT/s)Tamanho (MB)Largura de banda (GB/s)tipo DRAMLargura do barramento (bit)VulkanDirect3DOpenGLOpenCL[e]precisão únicaprecisão dupla
GeForce 405[f]16 de setembro de 2011GT216
GT218
40 nm486
260
100
57
148:16:8
16:8:4
475
589
1100
1402
800
790
3.8
2.36
7.6
4.71
512
1024
12.6DDR364n/a[17]10.13.31.1105.6
44.86
Desconhecido30.5OEM
GeForce GT 4203 de setembro de 2010GF108TSMC 40 nm58511648:4:4700140018002.82.851228.8GDDR312812 FL 11_14.6134.4Desconhecido50
GeForce GT 43011 de outubro de 2010GF108
GF108-300-A1
296:16:41600
1800
11.251225.6
28.8
1.2268.8Desconhecido60
1800512
1024
2048
28.81281.1268.8Unknown49$79
130010.464
GeForce GT 4401 de fevereiro de 2011GF10881016201800
3200
3.212.9102428.8
51.2
GDDR3
GDDR5
128311.04Desconhecido65$100
11 de outubro de 2010GF10611702383144:24:24810162018004.819.41536
3072
43.2DDR3192342.43Desconhecido56OEM
GeForce GTS 450790158040004.718.9153696.0GDDR5455.04Desconhecido106
13 de setembro de 2010
15 de março de 2011
GF106-250
GF116-200
4192:32:1678315661200-1600 (GDDR3)
3608 (GDDR5)
6.225.0512
1024
57.7128601.34Desconhecido106$129
GeForce GTX 460 SE15 de novembro de 2010GF104-225-A119503326288:48:32650130034007.831.21024108.8256748.8Desconhecido150$160
GeForce GTX 46011 de outubro de 2010GF1047336:56:329.136.41024108.8873.6DesconhecidoOEM
12 de julho de 2010GF104-300-KB-A1336:56:24675135036009.437.876886.4192907.2Unknown$199
336:56:321024
2048
115.2256160$229
24 de setembro de 2011GF114336:56:247791557400810.943.6102496.21921045.6Desconhecido$199
GeForce GTX 46531 de maio de 2010GF100-030-A33000[18]52911352:44:326081215320613.326.71024102.72561.2855.36106.92200[d]$279
GeForce GTX 47026 de março de 2010GF100-275-A314448:56:40334817.034.01280133.93201088.64136.08215[d]$349
GeForce GTX 48026 de março de 2010GF100-375-A315480:60:487011401369621.042.01536177.43841344.96168.12250[d]$499
ModeloLançamentoNome do códigoFab (nm)Transistores (Milhões)Tamanho da matriz (mm2)contagem de SMCore config[a][b]taxa de clockTaxa de preenchimentoConfiguração de memóriaSuporte API (versão)Poder de processamento (GFLOPS)[c]TDP (Watts)[d]Preço de lançamento (USD)
Core (MHz)Shader (MHz)Memória (MHz)Pixel (GP/s)Textura (GT/s)Tamanho (MB)Largura de banda (GB/s)tipo DRAMLargura do barramento (bit)VulkanDirect3DOpenGLOpenCL[e]precisão únicaprecisão dupla

Suporte descontinuado

A Nvidia anunciou que, após a versão 390 dos drivers, não lançará mais drivers de 32 bits para sistemas operacionais de 32 bits.[19]

A Nvidia anunciou em abril de 2018 que o Fermi mudará para o status de suporte de driver legado e será mantido até janeiro de 2019.[20]

Ver também

Notas

Referências

Ligações externas

O Commons possui uma categoria com imagens e outros ficheiros sobre GeForce 400