Startups como Fireworks, Baseten e Together AI alugam servidores Nvidia para desenvolvedores e ajudam a personalizar modelos open-source, crescendo mesmo com a concorrência dos grandes provedores de nuvem, que possuem vantagem por deterem os chips de IA.
Menos de um ano atrás, havia dúvidas sobre o futuro das startups chamadas provedores de inferência. Essas empresas alugam servidores Nvidia para desenvolvedores de aplicativos e auxiliam na personalização de modelos de inteligência artificial open-source.
Os grandes provedores de nuvem, que podem desenvolver essas capacidades internamente e possuem os chips de IA que alugam, representam concorrência direta. Enquanto isso, as startups alugam esses chips dos grandes provedores e os repassam aos clientes, o que tem reduzido as margens brutas de lucro de algumas delas.

