No início deste mês, a AMD lançou sua mais recente (e melhor) linha de GPUs Radeon RX 7900 XTX e XT de ponta baseadas na novíssima arquitetura AMD RDNA 3. O AMD RDNA 3 é uma nova abordagem para GPUs de alto desempenho, tem algumas novidades no segmento e também é um movimento muito comedido e tático da AMD para enfrentar o mercado de GPU de alto desempenho, onde a Nvidia tem grandes armas com a GeForce RTX 4090 que está no topo no momento.
Embora ainda não tenhamos recebido as amostras de análise da AMD (e mal podemos esperar para submeter as placas a uma bateria de testes extenuantes), este artigo se concentra em nos aprofundar um pouco mais na arquitetura RDNA 3 e nas chamadas que a AMD tomou. para maximizar o desempenho do jogo.
A AMD assume a liderança com o primeiro design de Chiplet do mundo para uma GPU para jogos.
A abordagem do chiplet não é inteiramente nova para a AMD, no entanto, é a primeira quando se trata de design de GPU. E o desafio de alcançar o ponto ideal onde a decisão de seguir a rota dos chips se justificasse em todos os aspectos foi a chave aqui para a AMD. A arquitetura da GPU é muito mais complexa (em comparação com as CPUs), dada a necessidade de largura de banda de memória muito maior e sensibilidade à latência, os engenheiros e designers de chips da AMD tiveram que trabalhar muito mais para fazer tudo funcionar e funcionar em níveis ideais.
Ao contrário dos designs de chips heterogêneos convencionais, com a abordagem Chiplet, a AMD dividiu a GPU em duas partes, o GCD (Graphics Compute Die) e o MCD (Memory Compute Die). O GCD é baseado em um nó de processo de 5 nm, enquanto o MCD usa um nó de processo de 6 nm.
Por que a AMD aceitou a chamada do chiplet e por que parece uma escolha inteligente.
De acordo com a AMD, os nós cada vez menores estão proporcionando cada vez menos ganhos, enquanto os rendimentos também estão diminuindo. O que significa que você precisa gastar muito mais para esse salto adicional de desempenho. O que impacta e eleva diretamente o custo de produção.
Com a abordagem de chiplet, a AMD afirma ter chegado a uma solução mais inteligente e ideal usando os nós de processo corretos e mais eficientes para o GCD e o MCD. No nó de 5 nm, o GCD consegue agregar muito mais poder de fogo sem aumentar o tamanho da matriz ou o consumo de energia. Enquanto o MCD usa um nó de 6 nm mais eficiente que permite uma abordagem mais econômica.
Mas e a interconexão?
O maior desafio que a AMD enfrentou ao escolher a rota do Chiplet foi gerenciar os requisitos de largura de banda e resolver o problema de latência. A interconexão foi resolvida usando uma interface de largura de banda ultra-alta personalizada que a AMD chama de interface de link fan out Infinity, que permite uma impressionante taxa de transferência de 5,3 TB/s entre o GCD e os MCDs.
Lidando com o fator de latência
O próximo problema crítico relacionado à abordagem do chiplet foi resolver a latência. A AMD afirma ter lidado com o fator latência aumentando a velocidade do clock. As velocidades de clock da GPU aumentaram 18% para atingir uma queda geral na latência de 10% em comparação com o Navi 21 (série AMD Radeon RX 6900).
Um grande salto no desempenho da computação gráfica
O processador gráfico principal abriga 48 WGPs (processadores de grupo de trabalho) no Navi 31 em comparação com 40 WGPs no Navi 21. E você ainda tem duas CUs (unidades de computação) por WGP. Portanto, a contagem total de unidades de computação aumentou de 80 no Navi 21 para 96 no Navi 31, um aumento modesto de 20%. Porém, o que mudou muito foram os recursos disponíveis para cada UC. Com o RDNA 3, cada uma das unidades de computação obtém o dobro da capacidade por ter um par de ALUs e unidades vetoriais.
Grande aumento no desempenho do Ray Tracing
A AMD não teve escolha a não ser trazer alguns ganhos significativos no que diz respeito ao desempenho do Ray Tracing. Com o RDNA 3, a AMD anunciou seu Ray Tracing Engine de segunda geração, que a empresa afirma melhorar o desempenho do ray tracing em até 80%. Uma afirmação bastante alta, só poderemos testá-lo quando tivermos os cartões em nosso centro de testes. A abordagem para obter maior desempenho de RT baseia-se em uma maneira mais inteligente de realizar as tarefas, em vez de usar força bruta. Tudo em uma tentativa de tornar as coisas mais eficientes. A AMD otimizou seu mecanismo de rastreamento de raios de segunda geração para extrair mais desempenho de cada raio usando seleção antecipada de subárvore junto com suporte de hardware para DXR Ray Flags, o que reduz significativamente a contagem de instruções necessária por loop. Alcançando assim maior eficiência em cargas de trabalho de RT.
Soham Raninga, Editor Chefe – Digit com Dra. Lisa T. Su – Diretora Executiva, AMD. No evento de lançamento da série AMD Radeon RX 7900 em Las Vegas.
Fizemos algumas perguntas difíceis (e outras não tão difíceis) durante nosso QnA com a AMD
Respondemos algumas perguntas à equipe por trás do RDNA 3 e aqui está o que eles têm a dizer.
Dígito: Quanto custo-benefício o design do chiplet traz em termos de% em relação à abordagem monolítica convencional?
Sam Naffziger (vice-presidente sênior e membro corporativo, AMD): Não posso dar detalhes sobre isso, nosso Navi 21 tinha 520 mm quadrados e, para ir para 5 nm com nosso design Navi 31, seria mais ou menos desse tamanho ou um pouco maior. E o rendimento do nó de tecnologia avançada será uma compra cara e, ao dividi-lo, será apenas uma maneira mais inteligente de projetar chips, especialmente porque 6 nm é muito maduro e altamente otimizado. Nas curvas de rendimento, há um ponto de inflexão, quando você chega em 400, 500 e 600mm quadrados, os custos realmente disparam.
Dígito: Veremos a abordagem do design do chip filtrando as placas de médio porte?
Sam Naffziger (vice-presidente sênior e membro corporativo, AMD): Como eu disse, a curva de rendimento não é linear e chega um ponto em que os chips não trazem benefícios. Não estamos falando sobre nossos produtos futuros, mas há um ponto em nossa linha de produtos em que um design tradicional é uma escolha melhor do que designs modernos.
Dígito: Até que ponto a AMD está trabalhando com as casas de desenvolvimento de jogos para otimizar o desempenho do jogo para RDNA 3, dada a abordagem do chiplet, será necessária otimização adicional no lado do desenvolvimento e suporte?
Laura Smith (CVP, MNC de gráficos e gerenciamento de produtos, Radeon Technologies Group): Estamos trabalhando amplamente com eles para aproveitar as vantagens do RDNA 3, eles realmente não precisam fazer nada adicional do ponto de vista do suporte, mas estamos trabalhando com eles para ajustar o software para o RDNA 3 como uma nova arquitetura.
Siga-nos
Soham Raninga
Soham Raninga é o editor-chefe do Digit.in. Um defensor do desempenho> recursos. O encontro de Soham com a tecnologia começou em dezembro de 1997, quando ele quase destruiu seu computador, tentando fazer a demo de Quake II rodar a >30FPS.
source – www.digit.in