Os gráficos realistas em jogos como Cyberpunk 2077 exigem placas de vídeo capazes de realizar cerca de 36 trilhões de cálculos por segundo. Para contextualizar, seria necessário o trabalho combinado de 4.400 planetas Terra, com cada pessoa realizando um cálculo por segundo, para igualar esse poder. O vídeo explora a arquitetura das GPUs (Unidades de Processamento Gráfico) em duas partes: o design físico e a arquitetura computacional, destacando sua aplicação em jogos, mineração de Bitcoin e redes neurais.
Enquanto uma CPU (Unidade Central de Processamento) possui poucos núcleos (como 24) e é versátil, capaz de executar sistemas operacionais e tarefas complexas, uma GPU tem milhares de núcleos (como 10.000) especializados em cálculos simples, como aritmética básica. A analogia usada é que a CPU é como um avião, rápido e flexível, enquanto a GPU é um navio de carga, lento mas com enorme capacidade. GPUs são ideais para processar grandes volumes de dados em paralelo, mas não substituem CPUs em tarefas diversificadas.
O coração da placa de vídeo é o chip GPU, como o GA102, com 28,3 bilhões de transistores. Ele é organizado em clusters (GPCs), multiprocessadores (SMs) e núcleos especializados: CUDA (cálculos básicos), Tensor (multiplicação de matrizes para IA) e Ray Tracing (traçado de raios). Durante a fabricação, defeitos podem desativar partes do chip, resultando em modelos com desempenhos diferentes (como a RTX 3080 vs. 3090). Cada núcleo CUDA contém cerca de 410 mil transistores e executa operações como multiplicação e adição em cada ciclo de clock.
A placa de vídeo inclui memória GDDR6X (24 GB no exemplo), com largura de banda de 1,15 TB/s, muito superior à memória RAM de CPUs (64 GB/s). Técnicas como PAM-3 (níveis múltiplos de tensão) aumentam a eficiência na transferência de dados. O resfriamento é essencial, com dissipadores de calor e ventoinhas para dissipar a energia térmica gerada pelo GPU e outros componentes, como o módulo regulador de voltagem, que converte 12V para 1,1V.
GPUs processam dados usando o princípio SIMD (Single Instruction, Multiple Data), aplicando a mesma instrução a múltiplos dados simultaneamente, como transformar coordenadas de vértices em um jogo. Em arquiteturas mais recentes (SIMT), os threads (grupos de instruções) podem progredir em ritmos diferentes, aumentando a flexibilidade. O “Gigathread Engine” gerencia a distribuição desses threads pelos núcleos, otimizando o processamento paralelo.
GPUs foram usadas na mineração de Bitcoin para executar o algoritmo SHA-256 em paralelo, gerando milhões de “bilhetes de loteria” por segundo. Hoje, circuitos especializados (ASICs) dominam essa tarefa. Já os núcleos Tensor aceleram redes neurais, realizando operações de multiplicação e adição de matrizes, essenciais para IA generativa. Essas operações são feitas em paralelo, aproveitando a arquitetura massivamente paralela das GPUs.
O vídeo encerra destacando a importância das GPUs em tecnologias modernas e agradecendo aos apoiadores. A Branch Education, criadora do conteúdo, visa produzir materiais educativos gratuitos e acessíveis sobre ciência e tecnologia, incentivando o público a se inscrever e compartilhar o vídeo. Links para mais informações sobre memória de alta velocidade (como HBM3E) e oportunidades de trabalho na Micron (patrocinadora) são disponibilizados na descrição.