technology

A100 é o ensaio geral

A IA deixa de ser projeto de laboratório e vira capex institucional.

14 de maio de 2020

O laboratório prova que algo é possível; o orçamento prova que alguém está com medo de ficar para trás.

infrastructure

A100 é o ensaio geral

A IA deixa de ser projeto de laboratório e vira capex institucional.

Em maio de 2020, o mundo está distraído por uma pandemia, cadeias de suprimento tensionadas, escritórios vazios, mercados distorcidos por política monetária e empresas tentando digitalizar em meses o que evitavam havia anos. Em meio a esse ruído, a computação acelerada dá mais um passo. O A100 não deve ser lido apenas como uma GPU nova. Deve ser lido como ensaio geral de uma era em que IA, analytics, treinamento e inferência começam a disputar o mesmo orçamento de infraestrutura.

O mercado gosta de dividir tecnologia em fases limpas. Primeiro pesquisa, depois produto, depois adoção, depois maturidade. A realidade é mais suja. Pesquisa, produto, medo competitivo, excesso de capital e infraestrutura avançam juntos. Às vezes o produto final ainda não está claro, mas a corrida por capacidade já começou. Empresas grandes não compram infraestrutura apenas porque sabem exatamente o que farão com ela. Compram também porque não sabem o que o concorrente fará.

A100 representa uma categoria de hardware desenhada para unificar cargas de trabalho que antes pareciam separadas: treinamento, inferência, análise de dados, HPC. O detalhe técnico importa, mas a leitura econômica importa mais. Quanto mais uma plataforma consegue servir múltiplas cargas, maior a chance de entrar no orçamento como ativo estratégico. Um chip especializado demais pode ficar preso a nicho. Um acelerador suficientemente versátil pode virar camada de data center.

Nvidia e AMD são os nomes óbvios. Nvidia porque lidera a narrativa e o ecossistema de computação acelerada. AMD porque qualquer cliente grande odeia dependência absoluta de um fornecedor, e porque data centers buscarão alternativas sempre que desempenho, preço, disponibilidade ou negociação permitirem. Mas os nomes menos óbvios indicam onde a expansão fica estrutural: Broadcom, Arista, Marvell, Credo.

Broadcom captura pedaços de conectividade, rede, silício de infraestrutura e componentes que ficam mais valiosos conforme data centers se tornam máquinas de tráfego interno. Arista captura a rede de alto desempenho e automação em ambientes de cloud. Marvell aparece em silício para infraestrutura, conectividade, armazenamento e data center. Credo, ainda menor e menos conhecida, representa a tese de interconexão de alta velocidade, cabos ativos e soluções para mover dados com eficiência.

O investidor precisa entender uma coisa simples: IA em escala é uma guerra contra espera. Espera para treinar. Espera para mover dados. Espera para buscar memória. Espera para sincronizar máquinas. Espera para entregar resposta ao usuário. Espera é custo. Empresas que reduzem espera capturam valor.

Talvez em 2022, com uma nova geração de aceleradores e uma narrativa mais madura em torno de IA generativa, o mercado comece a perceber que a corrida não é apenas por chips melhores, mas por sistemas inteiros. H100, ou qualquer geração posterior, seria o momento psicológico em que a indústria deixa de falar em experiências e começa a planejar capex. A diferença é enorme. Experimentos cabem em orçamento de inovação. Capex institucional entra em planejamento estratégico.

A forma de lucrar é observar a transição entre curiosidade e obrigação. Enquanto IA é curiosidade, empresas compram pouco, testam, chamam consultoria, fazem piloto e divulgam press release. Quando vira obrigação competitiva, compram capacidade antes de saber exatamente o ROI. Essa fase é perigosa para investidores em aplicações, mas poderosa para fornecedores de infraestrutura. Quem vende picareta não precisa que todo garimpeiro ache ouro. Precisa que muitos cavem.

Broadcom e Marvell podem capturar valor na camada de chips e conectividade. Arista pode capturar valor na arquitetura de rede. Credo pode capturar valor onde a interconexão entre componentes precisa de velocidade e eficiência. Nvidia captura o centro emocional da corrida. AMD tenta capturar a necessidade de alternativa. A pergunta não é quem tem a história mais bonita. É onde a restrição vai apertar primeiro.

A contratese é severa. A100 pode gerar entusiasmo antes de demanda sustentável. H100 pode virar símbolo caro demais. Empresas podem comprar demais e depois pausar. Aplicações podem não monetizar. A cadeia de rede pode sofrer competição e commoditização. Credo pode ser pequena demais e volátil demais. Marvell pode prometer exposição a data center e entregar mistura de ciclos. Arista pode ser excelente e ainda assim ficar cara. Broadcom pode ser mais conglomerado do que tese pura. AMD pode continuar atrás. Nvidia pode ser ótima empresa e ação ruim se comprada sem preço.

Mas o investidor não precisa negar esses riscos. Precisa entender o mecanismo. Quando uma plataforma computacional vira base de competição, os clientes compram capacidade em ondas. A primeira onda é técnica. A segunda é estratégica. A terceira é defensiva. A defensiva costuma ser a mais irracional e a mais lucrativa para fornecedores.

Em maio de 2020, ninguém precisa saber exatamente qual aplicação final vencerá. Essa é a beleza da tese. Talvez modelos de linguagem. Talvez recomendação. Talvez visão computacional. Talvez descoberta de drogas. Talvez segurança. Talvez automação de atendimento. Talvez programação assistida. Talvez análise industrial. A aplicação ainda pode ser incerta. A necessidade de acelerar experimentos é menos incerta.

O investidor que exige clareza total do produto final costuma pagar caro demais quando a clareza chega. O preço da clareza é retorno menor. O prêmio pertence a quem aceita incerteza técnica com estrutura econômica correta.

A100 é ensaio geral porque mostra a direção: data centers não serão apenas depósitos de CPUs. Serão fábricas heterogêneas, com aceleradores, redes rápidas, memória especializada e software de orquestração. A computação deixará de ser uma linha reta e se tornará uma arquitetura de múltiplos motores. Cada motor terá fornecedor, margem, ciclo e gargalo.

O mercado ensaia chamar isso de IA.

Eu chamaria de industrialização do cálculo.

Leo Bentier