Pesquisadores da Apple descobriram o “molho secreto” da DeepSeek, uma IA chinesa que, com seu modelo DeepSeek V3, promete revolucionar o mercado global de inteligência artificial, oferecendo desempenho avançado a um custo significativamente mais baixo do que os concorrentes.
A DeepSeek, startup chinesa fundada em 2023 por Liang Wenfeng, emergiu como um competidor significativo no campo da inteligência artificial, desafiando gigantes como OpenAI e Meta. Seu modelo de linguagem DeepSeek V3, lançado em 26 de dezembro de 2024, possui 671 bilhões de parâmetros, posicionando-se entre os maiores modelos de IA do mundo.
Pesquisadores da Apple, ao analisarem o DeepSeek V3, identificaram um “molho secreto” que contribui para seu desempenho superior e custo reduzido. A DeepSeek utilizou 2.048 placas H800 da NVIDIA, mais antigas e menos potentes, para treinar seu modelo a um custo total de US$ 5,5 milhões. Em comparação, modelos como o Llama 3.3 da Meta exigem investimentos significativamente maiores, com custos de treinamento que podem ultrapassar US$ 65 bilhões.
Essa abordagem inovadora permitiu à DeepSeek desenvolver uma IA competitiva a um custo até 10 vezes menor do que o de empresas como a Meta. Além disso, a startup adotou uma estratégia de código aberto, permitindo que desenvolvedores baixem, modifiquem e utilizem o modelo para diversas finalidades, incluindo aplicações comerciais.
O impacto da DeepSeek no mercado global de IA é significativo. Seu modelo de código aberto e custo reduzido desafia as estratégias de empresas estabelecidas, pressionando-as a repensar suas abordagens. Além disso, a eficiência e o desempenho do DeepSeek V3 destacam a crescente competitividade da China no setor de inteligência artificial.
Em resumo, a DeepSeek, com seu modelo DeepSeek V3, representa uma inovação disruptiva no campo da inteligência artificial, oferecendo desempenho avançado a um custo reduzido e desafiando as dinâmicas tradicionais do mercado global de IA.
Fonte: Revista Fórum/ Olhar Digital