A Nvidia está a preparar um novo chip destinado a acelerar a fase de inference da inteligência artificial — o momento em que os modelos geram respostas a pedidos dos utilizadores — e deverá apresentar uma nova plataforma na conferência GTC do próximo mês, segundo o Wall Street Journal, citado pela Reuters.
De acordo com a mesma informação, a nova plataforma foi pensada para melhorar a velocidade e a eficiência com que sistemas de IA respondem a pedidos, num mercado em que a procura por capacidade de processamento continua a subir. A Reuters acrescenta que a solução deverá incluir também um chip desenvolvido pela startup Groq.
O movimento surge numa altura em que empresas como a OpenAI procuram formas de acelerar tarefas de inference, uma área cada vez mais crítica à medida que os serviços de IA passam a depender de respostas mais rápidas e custos operacionais mais controlados.
🗞️ Artigos Relacionados:
A Reuters recorda ainda que a OpenAI tem mostrado insatisfação com a velocidade de parte do hardware atualmente usado em algumas cargas de trabalho e que procurava novo equipamento capaz de cobrir uma parcela das suas necessidades nesta área.
Nem a Nvidia nem a OpenAI responderam de imediato aos pedidos de comentário, segundo a Reuters.
Segundo o Wall Street Journal, a Nvidia está a desenvolver um novo processador orientado para o cálculo de “inference” — a etapa em que modelos de IA geram respostas a consultas — e deverá revelar uma plataforma que integra esse hardware na conferência GTC, marcada para o próximo mês. O projecto visa ajudar clientes como a OpenAI e outras empresas a obter respostas mais rápidas e maior eficiência no funcionamento dos seus sistemas de IA.
O mesmo relatório refere que a plataforma incluirá um chip concebido pela startup Groq. A Reuters disse não ter conseguido verificar de imediato estas informações e indicou que nem a Nvidia nem a OpenAI responderam a pedidos de comentário.
Reportagens anteriores da Reuters apontaram que a OpenAI tem expressado insatisfação com a velocidade de hardware da Nvidia em determinados tipos de tarefas, como desenvolvimento de software e interacção entre IA e outras aplicações. Uma fonte disse à Reuters que a OpenAI procura novo equipamento que, a prazo, cubra cerca de 10% das suas necessidades de “inference”.
Também segundo a Reuters, a OpenAI chegou a dialogar com startups como Cerebras e Groq sobre fornecimento de chips para aceleração de “inference”, mas essas conversações foram interrompidas depois de a Nvidia ter celebrado um acordo de licenciamento de 20 mil milhões de dólares com a Groq, segundo uma fonte citada.
Em setembro, a Nvidia anunciou a intenção de investir até 100 mil milhões de dólares na OpenAI, um acordo que implicaria participação acionista da fabricante de chips e permitiria à OpenAI obter fundos para comprar hardware avançado. O anúncio da nova plataforma na GTC será o próximo momento chave para clarificar como estes acordos e parcerias irão influenciar a disponibilidade e a distribuição dos chips para clientes como a OpenAI.
🤔 Faltou alguma coisa?
Ajude-nos a melhorar este conteúdo com a sua sugestão.