O Transformer cria uma dívida futura de computação
A arquitetura deixa de ser paper e começa a aparecer na conta de capex.
12 de junho de 2017
O Transformer cria uma dívida futura de computação
A arquitetura deixa de ser paper e começa a aparecer na conta de capex.
O mercado gosta de imaginar que revoluções intelectuais são leves. Um paper, uma equação, uma arquitetura, uma nova forma de organizar atenção, uma frase brilhante em PDF. Tudo parece barato enquanto está preso ao laboratório. Mas ideias poderosas têm uma característica incômoda: se funcionam, elas começam a pedir mundo físico. Pedem chips, memória, rede, energia, data centers, engenheiros, refrigeração, capital, tempo e tolerância a erro. A ideia nasce no papel. A conta chega no capex.
Em junho de 2017, a tese mais importante talvez não seja que um novo modelo de aprendizado de máquina pode superar abordagens anteriores em certas tarefas. A tese maior é que uma arquitetura mais escalável cria uma dívida futura de computação. Se modelos baseados em atenção permitirem treinar sistemas mais paralelizáveis, mais flexíveis e mais capazes de capturar relações complexas em linguagem e outros domínios, a demanda por compute não cairá. Ela aumentará. Eficiência em IA não reduz necessariamente consumo. Frequentemente expande o universo de problemas que vale a pena atacar.
Esse é um paradoxo que o mercado subestima. Quando uma tecnologia fica mais eficiente, ela pode consumir mais insumo, não menos, porque abre novos usos. Motores melhores não eliminaram transporte. Eletrificação mais eficiente não eliminou demanda por eletricidade. Computação mais barata não reduziu uso de computação. Ela criou software infinito. O Transformer, se cumprir parte da promessa, pode fazer o mesmo com modelos de linguagem, tradução, busca, geração, classificação, código, agentes e interfaces.
O investidor que olha apenas para o paper perde o rastro do dinheiro. O paper não será listado em bolsa. O paper não terá margem bruta. O paper não recomprará ações. Mas a infraestrutura exigida por ele poderá alimentar dezenas de empresas. Nvidia e AMD são os nomes óbvios. Arista, Marvell, Broadcom e Vertiv são menos óbvios, e talvez por isso revelem melhor a tese.
Nvidia representa a camada de aceleração. Se modelos maiores, paralelizáveis e treinados em massa de dados começarem a vencer, o orçamento tende a procurar GPUs e sistemas de computação acelerada. AMD representa competição possível, especialmente se o mercado quiser alternativas, negociação, arquitetura aberta ou diversificação de fornecedor. Mas o erro será achar que tudo se resume ao acelerador. Modelos grandes não vivem sozinhos dentro de um chip. Eles vivem em clusters.
Arista importa porque clusters precisam falar. Quanto maior o treinamento, maior a pressão sobre rede. Quando milhares de GPUs precisam trabalhar coordenadas, a comunicação entre máquinas pode se tornar tão crítica quanto a capacidade de cada máquina. A rede deixa de ser periferia e vira condição de produtividade. Um acelerador esperando dado é capital caro parado. Latência e largura de banda, palavras sem charme, podem decidir economia.
Marvell e Broadcom aparecem como fornecedores de silício e conectividade para uma infraestrutura que precisa mover dados de forma cada vez mais agressiva. À medida que data centers se transformam em fábricas de modelos, a movimentação interna de dados vira gargalo. O investidor que só conhece empresas por produtos de consumo não entende que semicondutores de rede, controladores, interconexões e chips especializados podem capturar valor sem nunca aparecerem no feed de ninguém.
Vertiv é outro tipo de resposta. Se a tese de IA crescer, energia e refrigeração deixam de ser utilidade genérica e passam a ser problema estratégico. O chip mais poderoso é inútil se o rack não aguenta densidade, se o calor não sai, se a disponibilidade falha, se o cliente não consegue expandir capacidade. O mundo digital finge ser etéreo, mas sempre retorna ao mesmo triângulo: energia, calor e espaço.
Talvez em 2020 o mercado veja um acelerador de nova geração e comece a entender que treinamento e inferência não são apenas tarefas acadêmicas. Talvez a nuvem, as grandes plataformas e os laboratórios passem a absorver compute de forma mais agressiva. Talvez alguns analistas ainda digam que o mercado endereçável é incerto. Eles estarão certos no detalhe e atrasados na estrutura. O tamanho exato do mercado é incerto. A direção da fome computacional, se modelos escalarem, é menos incerta.
A forma de lucrar é pensar em dívida. O Transformer cria uma dívida de computação porque, se for útil, todo avanço posterior tentará escalar: mais parâmetros, mais dados, mais contexto, mais modalidades, mais usuários, mais inferência. Cada camada de sucesso gera nova demanda na camada inferior. O usuário pede resposta instantânea. O produto pede modelo maior. O modelo pede GPU. A GPU pede rede. A rede pede silício. O silício pede energia. A energia pede infraestrutura. A infraestrutura pede capital. No fim, a frase "IA" se transforma em uma sequência de notas fiscais.
O mercado demora para enxergar notas fiscais quando está seduzido por demonstrações. Demonstrações mostram possibilidade. Notas fiscais mostram monetização de fornecedores. O investidor deve acompanhar quem paga e quem recebe. Se laboratórios e hyperscalers começam a gastar somas crescentes em treinamento, alguém está vendendo infraestrutura antes que o usuário final pague assinatura suficiente para justificar tudo. Esse descompasso pode ser bolha em uma camada e fundamento em outra.
É possível que consumidores demorem a pagar por IA. É possível que a monetização de aplicações seja confusa. É possível que muitos produtos sejam destruidores de margem. Mas isso não impede que a corrida por modelos gere capex real. A história da tecnologia frequentemente separa quem cria a febre de quem vende termômetro. Nem sempre a empresa mais adorada é a que captura melhor o dinheiro inicial.
A contratese precisa ser dura. O Transformer pode ser importante academicamente e ainda assim demorar para gerar retorno econômico. Modelos podem ficar caros demais. Reguladores podem interferir. Dados podem se tornar gargalo. Clientes podem rejeitar automação. Infraestrutura pode ser comprada em excesso. Nvidia pode ser precificada como se toda demanda futura fosse certa. Arista pode sofrer compressão. Marvell e Broadcom podem enfrentar ciclos. Vertiv pode ser tratada como infraestrutura pesada, com margem inferior ao entusiasmo narrativo. Uma cadeia inteira pode subir antes da receita final aparecer.
Mas a ausência de lucro imediato na aplicação não destrói automaticamente a tese de infraestrutura. Ela apenas exige disciplina. O investidor precisa distinguir entre três perguntas: a tecnologia funciona? alguém gastará para escalá-la? quem captura margem durante a escalada? Muitas pessoas confundem as três. É possível responder "ainda não sei" para a primeira, "provavelmente sim" para a segunda e "a cadeia de infraestrutura" para a terceira.
Isso não é cinismo. É análise de fluxo.
O mercado ama histórias de inteligência porque elas alimentam vaidade. Mas a história lucrativa pode ser mais vulgar: modelos maiores exigem mais máquinas. A vulgaridade é uma vantagem. Ideias sofisticadas demais podem morrer em comitês. Necessidades físicas aparecem no orçamento.
Se o Transformer abrir caminho para sistemas que lidam melhor com linguagem, contexto e relação entre partes de uma sequência, a consequência não será apenas melhor tradução ou melhor texto. Será uma nova corrida por escala. Cada laboratório tentará descobrir se mais dados, mais parâmetros e mais compute produzem comportamento emergente. Essa corrida pode ser absurda. Justamente por isso pode ser lucrativa para quem vende os insumos.
O leitor deve desconfiar de quem diz que "o algoritmo venceu o hardware". Algoritmos bons frequentemente aumentam o apetite por hardware porque tornam o hardware mais útil. O software que descobre uma nova forma de usar compute cria demanda por compute. A eficiência não mata a fábrica. Ela justifica construir outra.
Talvez em alguns anos o mercado chame isso de boom de IA. Talvez diga que ninguém poderia prever. Mas o mecanismo estará visível antes: uma arquitetura que escala, dados abundantes, capital procurando vantagem, nuvens capazes de vender infraestrutura e chips preparados para acelerar a corrida.
O futuro não chega como profecia.
Chega como gargalo.
Leo Bentier