Tendências do dia

"Foi 100% culpa nossa": chefe da NVIDIA não ignora problemas quando algo dá errado

Uma falha de design fez com que o desempenho de fabricação da GPU B200 fosse menor do que o esperado

O problema agora está resolvido. A TSMC e a NVIDIA vão começar a fabricar este chip em larga escala em breve

Nvidia
Sem comentários Facebook Twitter Flipboard E-mail
pedro-mota

PH Mota

Redator

Jornalista há 15 anos, teve uma infância analógica cada vez mais conquistada pelos charmes das novas tecnologias. Do videocassete ao streaming, do Windows 3.1 aos celulares cada vez menores.

Quando a NVIDIA revelou seu chip B200 para aplicações de inteligência artificial (IA) em março deste ano, ficou claro que tinha uma verdadeira fera em suas mãos. Seus recursos são de tirar o fôlego: 208 bilhões de transistores, arquitetura 'Blackwell' de última geração, desempenho máximo de 20 petaFLOPS em operações FP4 se acompanhado de resfriamento líquido, pode trabalhar lado a lado com um mapa de memória de até 192 GB de VRAM e atinge uma largura de banda de 8 TB/s.

Curiosamente, as primeiras unidades do chip B200 demoraram muito para chegar. A NVIDIA confessou que o desempenho de seus processos de fabricação foi menor do que o esperado, o que forçou seus engenheiros a redesenhar algumas camadas do chip para corrigir um problema que atrasou a entrega das primeiras unidades. "Fomos forçados a introduzir uma mudança na máscara de GPU Blackwell para melhorar o desempenho da produção", admitiu a NVIDIA em comunicado.

Jensen Huang mostrou a cara

As mudanças introduzidas pelos técnicos da empresa funcionaram. A fabricação em larga escala deste chip já está em andamento e, presumivelmente, a NVIDIA conseguiu corrigir os problemas que dificultavam o desempenho de seus processos de fabricação. Para aguçar seu apetite, a empresa publicou em seu blog os primeiros índices de desempenho do chip B200. Sabíamos que seria muito poderoso e, sim, esses primeiros números refletem que, quando chegar, será, sem dúvida, a GPU de IA mais capaz do mercado, embora a coisa mais prudente a fazer seja observar os números da NVIDIA com algum ceticismo.

O curioso é que os problemas que surgiram durante a fabricação dos chips B200 fizeram com que alguns meios de comunicação sugerissem que a TSMC era a responsável e que seu relacionamento com a NVIDIA havia se deteriorado por esse motivo. Nada poderia estar mais longe da verdade. Jensen Huang declarou que a NVIDIA é responsável pelo problema e que, graças à colaboração da TSMC, eles conseguiram resolvê-lo e estar prontos para iniciar a produção em larga escala deste chip avançado para inteligência artificial.

"A NVIDIA foi 100% culpada. Tivemos uma falha de design na Blackwell. Era um chip funcional, mas o defeito causou um desempenho ruim [...] Os relatórios que descrevem tensões entre a NVIDIA e a TSMC são falsos", disse Jensen Huang. É evidente que o chefe da NVIDIA está assumindo total responsabilidade pelo problema com a GPU B200 e quer evitar a todo custo que a TSMC saia mal deste revés. Como acabamos de ver, a produção deste chip não foi nada fácil para a NVIDIA, mas esta empresa espera entregar as primeiras unidades desta GPU antes do final deste ano.

Imagem | NVIDIA

Inicio