GeForce 700


A série GeForce 700 (estilizada como GEFORCE GTX 700 SERIES) é uma família de unidades de processamento gráfico desenvolvida pela Nvidia. Embora seja principalmente uma atualização da microarquitetura Kepler (chips de codinome GK), algumas placas usam Fermi (GF) e placas posteriores usam Maxwell (GM). As placas da série GeForce 700 foram lançadas pela primeira vez em 2013, começando com o lançamento da GeForce GTX Titan em 19 de fevereiro de 2013, seguida pela GeForce GTX 780 em 23 de maio de 2013. Os primeiros chips móveis da série GeForce 700 foram lançados em abril de 2013.

NVIDIA GeForce 700
GeForce 700
GTX 780 Ti Founders Edition lançada em 2013, a principal unidade da série
Data de lançamento19 de fevereiro de 2013
Codinome(s)GK110
GK208
FabricanteNVIDIA
Arquitetura
Fermi
Kepler
Maxwell
Transistores
Modelos
GPU Básica
  • GeForce GT 705
  • GeForce GT 710
  • GeForce GT 720
  • GeForce GT 730
  • GeForce GT 740
  • GeForce GTX 745
GPU Intermediária
  • GeForce GTX 750
  • GeForce GTX 750 Ti
  • GeForce GTX 760 192-Bit
  • GeForce GTX 760
  • GeForce GTX 760 Ti
  • GeForce GTX 770
GPU Topo-de-linha
  • GeForce GTX 780
Versões dos drivers
Direct3DDirect3D 12.0 (nível de recurso 11_0)[1][2] Shader Model 6.7 (Maxwell), Shader Model 6.5 (Kepler) ou Shader Model 5.1 (Fermi)
OpenCLOpenCL 3.0[a]
OpenGLOpenGL 4.6
Cronologia
AnteriorGeForce 600
SucessorGeForce 900
ConcorrenteRadeon RX 200

Visão geral

O GK110 foi projetado e comercializado tendo em mente o desempenho computacional. Ele contém 7,1 bilhões de transistores. Este modelo também tenta maximizar a eficiência energética através da execução de tantas tarefas quanto possível em paralelo de acordo com as capacidades de seus processadores de streaming.

Com o GK110, são vistos aumentos no espaço de memória e largura de banda para o arquivo de registro e o cache L2 em relação aos modelos anteriores. No nível SMX, o espaço do arquivo de registro do GK110 aumentou para 256KB composto por registros de 64K de 32 bits, em comparação com os registros de 32K de 32 bits do Fermi, totalizando 128 KB. Quanto ao cache L2, o espaço do cache GK110 L2 aumentou em até 1,5 MB, 2x maior que o GF110. Tanto o cache L2 quanto a largura de banda do arquivo de registro também dobraram. O desempenho em cenários de falta de registro também é aprimorado, pois há mais registros disponíveis para cada encadeamento. Isso acompanha o aumento do número total de registradores que cada thread pode endereçar, passando de 63 registradores por thread para 255 registradores por thread com GK110.

Com o GK110, a Nvidia também retrabalhou o cache de textura da GPU para ser usado para computação. Com 48 KB de tamanho, na computação, o cache de textura torna-se um cache somente leitura, especializado em cargas de trabalho de acesso à memória desalinhadas. Além disso, recursos de detecção de erros foram adicionados para torná-lo mais seguro para uso com cargas de trabalho que dependem de ECC.[3]

A série também suporta DirectX 12 no Windows 10.[4]

A Super Resolução Dinâmica (DSR) foi adicionada às GPUs Kepler com os drivers Nvidia mais recentes.[5]

Arquitetura

Ver artigo principal: Microarquitetura Fermi
O PCB de uma GTX 780.
Uma GPU GTX 780M com soquete MXM.

A série GeForce 700 contém recursos do GK104 e do GK110. Os membros baseados em Kepler da série 700 adicionam os seguintes recursos padrão à família GeForce.

Derivado do GK104:

  • Interface PCI Express 3.0
  • DisplayPort 1.2
  • Saída de vídeo HDMI 1.4a 4K x 2K
  • Aceleração de vídeo por hardware Purevideo VP5 (decodificação de até 4K x 2K H.264)
  • Bloco de aceleração de codificação H.264 de hardware (NVENC)
  • Suporte para até 4 monitores 2D independentes ou 3 monitores estereoscópicos/3D (NV Surround)
  • Texturas sem encadernações
  • GPU Boost
  • TXAA
  • Fabricado pela TSMC em um processo de 28 nm

Novos recursos do GK110:

  • Melhoria do Compute Focus SMX
  • Capacidade de computação CUDA 3.5
  • Novas instruções aleatórias
  • Paralelismo Dinâmico
  • Hyper-Q (funcionalidade MPI do Hyper-Q reservada apenas para Tesla)
  • Unidade de Gerenciamento de Rede
  • NVIDIA GPUDirect (funcionalidade RDMA do GPU Direct reservada apenas para Tesla e Quadro)
  • GPU-Boost 2.0

Melhoria SMX de foco de computação

Com o GK110, a Nvidia optou por aumentar o desempenho de computação. A maior mudança do GK104 é que, em vez de 8 núcleos FP64 CUDA dedicados, o GK110 tem até 64, proporcionando 8x a taxa de transferência FP64 de um GK104 SMX. O SMX também vê um aumento no espaço para arquivo de registro. O espaço do arquivo de registro aumentou para 256 KB em comparação com o Fermi. O cache de textura também foi aprimorado. Com um espaço de 48 KB, o cache de textura pode se tornar um cache somente leitura para cargas de trabalho de computação.[3]

Novas instruções aleatórias

Em um nível baixo, o GK110 vê instruções e operações adicionais para melhorar ainda mais o desempenho. Novas instruções de shuffle permitem que threads dentro de um warp compartilhem dados sem voltar para a memória, tornando o processo muito mais rápido do que o método load/share/store anterior. As operações atômicas também foram revisadas, acelerando a velocidade de execução das operações atômicas e adicionando algumas operações FP64 que antes estavam disponíveis apenas para dados FP32.[3]

Hyper-Q

O Hyper-Q expande as filas de trabalho de hardware GK110 de 1 para 32. O significado disso é que ter uma única fila de trabalho significava que o Fermi poderia estar ocupado às vezes, pois não havia trabalho suficiente naquela fila para preencher todos os SM. Por ter 32 filas de trabalho, o GK110 pode, em muitos cenários, obter maior utilização ao ser capaz de colocar diferentes fluxos de tarefas no que, de outra forma, seria um SMX ocioso. A natureza simples do Hyper-Q é ainda mais reforçada pelo fato de ser facilmente mapeado para MPI, uma interface comum de troca de mensagens frequentemente usada em HPC. Como algoritmos legados baseados em MPI que foram originalmente projetados para sistemas multi-CPU que se tornaram gargalos por falsas dependências, agora têm uma solução. Ao aumentar o número de tarefas MPI, é possível utilizar o Hyper-Q nesses algoritmos para melhorar a eficiência sem alterar o próprio código.[3]

Suporte Microsoft DirectX

As GPUs Nvidia Kepler da série GeForce 700 suportam totalmente o DirectX 11.0.

A Nvidia oferece suporte à API DX12 em todas as GPUs da classe DX11 fornecidas; estes pertencem às famílias arquitetônicas Fermi, Kepler e Maxwell.[1]

Paralelismo dinâmico

A capacidade de paralelismo dinâmico é para que os kernels possam despachar outros kernels. Com o Fermi, apenas a CPU poderia despachar um kernel, o que gera uma certa sobrecarga por ter que se comunicar de volta com a CPU. Ao dar aos kernels a capacidade de despachar seus próprios kernels filhos, o GK110 pode economizar tempo por não ter que voltar para a CPU e, no processo, liberar a CPU para trabalhar em outras tarefas.[3]

Produtos

GeForce série 700 (7xx)

GeForce GTX 780 Ti instalada em um PC em uma configuração SLI de 2 vias

A série GeForce 700 para arquitetura de desktop. Esperava-se que produtos mais baratos e de menor desempenho fossem lançados com o tempo. Kepler oferece suporte a recursos 11.1 com nível de recurso 11_0 por meio da API DirectX 11.1, no entanto, a Nvidia não habilitou quatro recursos não relacionados a jogos em Hardware no Kepler (para 11_1).[6][7]

  • 1 Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização
  • 2 A taxa de preenchimento do pixel é calculada como o número de ROPs multiplicado pela velocidade base do clock do núcleo
  • 3 A taxa de preenchimento da textura é calculada como o número de TMUs multiplicado pela velocidade do clock base do núcleo.
  • 4 O desempenho de precisão única é calculado como 2 vezes o número de shaders multiplicado pela velocidade base do clock do núcleo.
  • 5 O desempenho de precisão dupla da GTX Titan e GTX Titan Black é 1/3 ou 1/24 do desempenho de precisão simples, dependendo de uma opção de configuração selecionada pelo usuário no driver que aumenta o desempenho de precisão simples se a precisão dupla for definida como 1/24 de desempenho de precisão simples,[8] enquanto o desempenho de precisão dupla de outros chips Kepler é fixado em 1/24 de desempenho de precisão simples.[9] O desempenho de precisão dupla dos chips GeForce série 700 Maxwell é 1/32 do desempenho de precisão simples.[10]
  • 6 SLI suporta a conexão de até 4 placas gráficas idênticas para uma configuração SLI de 4 vias. Aqueles que suportam SLI de 4 vias podem suportar SLI de 3 e 2 vias, no entanto, uma placa de GPU dupla já implementa SLI de 2 vias internamente, portanto, apenas 2 placas de GPU dupla podem ser usadas em SLI para fornecer um SLI de 4 vias configuração.

GeForce série 700M (7xxM)

Algumas implementações podem usar especificações diferentes.

  • 1 Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização
ModeloLançamentoNome do códigoFab (nm)interface de BarramentoCore config1taxa de clockTaxa de preenchimentoMemóriaSuporte API (versão)Poder de processamento2
(GFLOPS)
TDP (watts)Notas
Core (MHz)Shader (MHz)Memória (MHz)Pixel (GP/s)Textura (GT/s)Tamanho (MiB)Largura de banda (GB/s)Tipo de barramentoLargura do barramento (bit)DirectXOpenGLOpenCLVulkan
GeForce 705M [11]1 de junho de 2023GF119[b]40PCIe 2.0 x1648:8:4775155018001.485.9até 2048?DDR36412.0 (11_0)4.61.11.3141.712Rebatizado 520M
GeForce 710M [12]1 de Abril de 2013GF117[b]2896:16:4775155018003.112.4até 204814.464297.615
GeForce GT 720M [13]1 de Abril de 201396:16:4800160016002.510até 204812.86424033
25 de dezembro de 2013GK208192:16:88002.911.51.227633
GeForce GT 730M [14]1 de Abril de 2013GK107PCIe 3.0 x16384:32:1672572518005.823até 204814.4 – 64.0DDR3 GDDR51281.1552.233
6 de março de 2014GK208PCIe 2.0 x8384:16:85.811.564
GeForce GT 735M [15]1 de Abril de 2013PCIe 2.0 x8384:32:888988920004.69.2até 204816.0DDR3641.2441.633
GeForce GT 740M [16]1 de Abril de 2013GK107PCIe 3.0 x16384:32:16810-1033810-10331800/36006.4825.9até 204814.4 – 57.6DDR3 GDDR51281.1622.145
20 de junho de 2013GK208PCIe 3.0 x8384:16:8980-1033980-10337.8415.7641.2752.633
GeForce GT 745M [17]1 de abril de 2013GK107PCIe 3.0 x16384:32:168378372000 – 50004.3917.6até 204832.0 – 80.0128642.845
GeForce GT 750M [18]1 de abril de 2013384:32:169679672000 – 50007.5330.1até 409632 – 801281.1722.750
GeForce GT 755M [19]Desconhecido384:32:1610201020540015.731.4até 204886.4GDDR5128752.650
GeForce GTX 760M [20]30 de maio de 2013GK106768:64:1665765740081040.2204864.1128964.655
GeForce GTX 765M [21]30 de maio de 2013768:64:16850850400812.851204864.11281.2122475
GeForce GTX 770M [22]30 de maio de 2013960:80:24811811400814.156.5307296.2192135675
GeForce GTX 780M [23]30 de maio de 2013GK1041536:128:32823823500024.798.74096160.02562369100

Tabela de chipsets

GeForce série 700 (7xx)

ModeloLançamentoNome do códigoFab (nm)Transistores (Milhões)Tamanho da matriz (mm2)interface de Barramentocontagem SMXCore config[a]Taxa de clockTaxa de preenchimentoConfiguração de memóriaVersão de API suportadaPoder de processamento (GFLOPS)[b]TDP (Watts)Preço de lançamento (USD)
Base (MHz)Boost Médio (MHz)Max Boost[c] (MHz)Memória (MHz)Pixel (GP/s)Textura (GT/s)Tamanho (MB)largura de banda (GB/s)Tipo de DRAMLargura de barramento (bit)Vulkan[d]Direct3D[e]OpenGLOpenCLprecisão únicaprecisão dupla
GeForce GT 705[27][f]27 de março de 2014GF119-300-A1TSMC 40 nm29279PCIe 2.0 x16148:8:4810898
(1796)
3.246.5512
1024
14.4DDR364n/a124.61.1155.519.429OEM
GeForce GT 710[28]GK208-301-A1TSMC 28 nm102079PCIe 2.0 x8192:16:8823900 (1800)6.613.2512641.21.2316.013.2
26 de janeiro de 2016GK208-203-B1PCIe 2.0 x8, PCIe x1192:16:8954900 (1800)
1253 (5010)
7.615.31024
2048
14.4
40.0
DDR3
GDDR5
36615.319$35–45
GeForce GT 720[29]27 de março de 2014GK208-201-B1PCIe 2.0 x8192:16:8797900 (1800)
1253 (5010)
6.412.81024
2048
14.4
40.0
30612.8$49–59
GeForce GT 730
[30][g][h]
18 de junho de 2014GK208-301-A12384:16:8902900
(1800)
7.2214.441024[31]
2048
4096
14.4DDR3692.728.923$69–79
GK208-400-A1384:16:89021250
(5000)
7.2214.441024
2048[32]
40.0GDDR525
GF108TSMC 40 nm585116PCIe 2.0 x1696:16:4700900
(1800)
2.811.01024
2048
4096
28.8DDR3128n/a1.1268.833.649
GeForce GT 740[i]29 de maio de 2014GK107-425-A2TSMC
28HP
1270118PCIe 3.0 x16384:32:16993891
(1782)
15.931.828.51281.21.2762.631.864$89–99
384:32:169931252
(5008)
15.931.880.1GDDR5
GeForce GTX 74518 de fevereiro de 2014GM107-220-A218701483384:24:161033DesconhecidoDesconhecido900
(1800)
16.524.81024
4096
28.8DDR31.3793.324.855OEM
GeForce GTX 750GM107-300-A24512:32:161020108511631250
(5000)
16.332.61024
2048
4096[33]
80GDDR51044.532.6$119
GeForce GTX 750 TiGM107-400-A25640:40:161020108512001350
(5400)
16.340.81024
2048
4096
86.41305.640.860$149
GeForce GTX 760 192-bit17 de outubro de 2013GK104-200-KD-A2354029461152:96:248248888891450
(5800)
19.879.11536
3072
134.41921.21896.279.0130OEM
GeForce GTX 76025 de junho de 2013GK104-225-A21152:96:32980103311241502
(6008)
31.4[j]942048
4096
192.32562257.994.1170$249 ($219)
GeForce GTX 760 Ti[k]27 de setembro de 2013[34]GK10471344:112:3291598010841502
(6008)
29.3102.52048192.32459.5102.5OEM
GeForce GTX 77030 de maio de 2013GK104-425-A281536:128:321046108511301752.5
(7010)
33.51342048 40962243213.3133.9230$399 ($329)
GeForce GTX 78023 de maio de 2013GK110-300-A17080561122304:192:4886390010021502
(6008)
41.4[j]160.53072 6144[35]288.43843976.7165.7$649 ($499)
GeForce GTX 780 Ti[36][37][38]7 de novembro de 2013GK110-425-B1152880:240:4887692810191752.5
(7010)
42.0[j]210.23072336.55045.7210.2$699
GeForce GTX TITAN[39][40][41]21 de fevereiro de 2013GK110-400-A1142688:224:488378769931502
(6008)
40.2187.56144288.44499.71300[42]-1499.9$999
GeForce GTX TITAN Black18 de fevereiro de 2014GK110-430-B1152880:240:4888998010581752.5
(7010)
42.7213.4336.55120.61706.9
GeForce GTX TITAN Z28 de maio de 20142x GK110-350-B1[43]2x 70802x 5612x 152x 2880:240:48705876Desconhecido1752.5
(7010)
2x 33.82x 1692x 61442x 336.52x 3844.55046x21682x2[44]375$2999
ModeloLançamentoNome do códigoFab (nm)Transistores (Milhões)Tamanho da matriz (mm2)interface de Barramentocontagem SMXCore config[a]Taxa de clockTaxa de preenchimentoConfiguração de memóriaVersão de API suportadaPoder de processamento (GFLOPS)[k]TDP (Watts)Preço de lançamento (USD)
Base (MHz)Boost Médio (MHz)Max Boost[c] (MHz)Memória (MHz)Pixel (GP/s)Textura (GT/s)Tamanho (MB)largura de banda (GB/s)Tipo de DRAMLargura de barramento (bit)VulkanDirect3D[e]OpenGLOpenCLprecisão únicaprecisão dupla

Suporte descontinuado

A Nvidia anunciou que, após a versão 390.x dos drivers, não lançará mais drivers de 32 bits para sistemas operacionais de 32 bits.[45]

A Nvidia anunciou que as GPUs de notebook Kepler farão a transição para o suporte legado a partir de abril de 2019 e serão suportadas até abril de 2020.[46] Todas as GPUs de notebook da família 7xxM são afetadas por essa mudança.

A Nvidia anunciou que, após os drivers da versão 470, faria a transição do suporte de driver para os sistemas operacionais Windows 7 e Windows 8.1 para o status legado e continuaria a fornecer atualizações críticas de segurança para esses sistemas operacionais até setembro de 2024.[47]

A Nvidia anunciou que todas as GPUs de desktop Kepler restantes passariam para o suporte legado a partir de setembro de 2021 e seriam suportadas para atualizações críticas de segurança até setembro de 2024.[48] A Nvidia GeForce GTX 745, 750 e 750 Ti da família de GPUs de desktop 7xx não seria afetados por esta mudança.

No Windows, o último driver a oferecer suporte total ao CUDA com capacidade de computação de 64 bits 3.5 para Kepler no Windows 7 e Windows 8.1 de 64 bits é o 388.71, testado com o CUDA-Z e GPU-Z mais recente, depois desse driver, o CUDA de 64 bits suporte torna-se quebrado para GeForce 700 série GK110 com arquitetura Kepler.

O último driver em que a detecção do tipo de monitor está funcionando corretamente no Windows XP é 352.86.[49]

Ver também

Referências


Ligações externas