Tendências do dia

DeepSeek: o que é, como funciona e quais opções essa inteligência artificial possui

Explicamos em detalhes e de maneira simples o que é o DeepSeek e por que essa inteligência artificial da China está se destacando tanto

DeepSeek é nova IA chinesa de código aberto / Imagem: Xataka
Sem comentários Facebook Twitter Flipboard E-mail
victor-bianchin

Victor Bianchin

Redator

Victor Bianchin é jornalista.

Vamos explicar o que é DeepSeek, o chat de inteligência artificial criado pela empresa de mesmo nome. Trata-se de uma IA que, desde o início de 2025, tem chamado muita atenção e que, inclusive, já conseguiu igualar e até superar o ChatGPT em downloads nas lojas de aplicativos móveis. E, como se não bastasse, nos testes de desempenho e raciocínio, também conseguiu se equiparar com seu modelo R1.

Nos últimos meses, a internet tem falado bastante sobre essa empresa e seus modelos, e tudo indica que continuará a fazê-lo. Principalmente porque esses modelos são de código aberto, o que os torna mais acessíveis para todos, e porque demonstram o grande avanço da China nas tecnologias de inteligência artificial.

O que é o DeepSeek?

DeepSeek

DeepSeek é o nome de uma empresa da China especializada em inteligência artificial. Também é o nome de seu chat de IA, uma alternativa ao Copilot, Gemini e outros. Portanto, você pode ouvir ou ler menções ao DeepSeek se referindo a ambas as coisas.

Neste texto, vamos nos concentrar no chatbot de inteligência artificial, que é um Grande Modelo de Linguagem ou Large Language Model (LLM), criado para auxiliar no desenvolvimento de software, no processamento de linguagem natural e na automação empresarial.

O DeepSeek se destaca por ser de código aberto. Isso significa que qualquer pessoa pode ver como ele funciona internamente, sendo totalmente transparente, e pode instalar essa IA localmente ou usá-la com total liberdade. Um desenvolvedor ou pesquisador pode baixá-lo do GitHub e modificá-lo para diversos cenários, incluindo usos comerciais.

Além disso, o fato de estar disponível e ter código aberto também significa que qualquer um de nós pode baixá-lo e executá-lo em seu próprio computador. Isso pode torná-lo mais lento, mas garante que tudo o que você escrever e interagir fique armazenado no seu dispositivo, sem que a empresa chinesa tenha acesso. Ou seja, tudo permanece no seu PC. Isso contrasta totalmente com a falta de sigilo e privacidade de outros modelos.

Costuma-se ter a falsa percepção de que uma das vantagens do código privado da maioria das desenvolvedoras é que a qualidade de seus produtos é superior. No entanto, o DeepSeek é uma prova de que o código aberto pode igualar e até superar essas empresas em alguns aspectos.

Outra das principais características do DeepSeek é que seu chatbot nativo, disponível em seu site oficial, é totalmente gratuito e não exige nenhuma assinatura para utilizar seu modelo mais avançado. Além disso, você pode usar o DeepSeek em português simplesmente falando com ele nesse idioma.

Se o compararmos com o ChatGPT respondendo às mesmas perguntas, o DeepSeek pode ser um pouco mais direto e objetivo. No entanto, ele possui a mesma flexibilidade de outros modelos, permitindo que você peça explicações mais detalhadas ou adaptadas às suas necessidades.

Dois modelos de IA como destaque

DeepSeek

O DeepSeek gerou muito burburinho no final de 2024 e início de 2025 por conta de dois modelos de IA específicos. O primeiro é o DeepSeek V3, um modelo LLM de grande escala que supera a maioria das inteligências artificiais e até mesmo algumas proprietárias. Em testes como os de programação, esse modelo conseguiu superar o Llama 3.1 405B, o GPT-4o e o Qwen 2.5 72B, embora todos eles tenham muito menos parâmetros, o que pode influenciar no desempenho e nas comparações.

Mas o que realmente surpreendeu nesse modelo foi o fato de que ele precisou de "apenas" 2,7 bilhões de horas de treinamento. E há também a questão do custo desse treinamento. Estima-se que tenha custado apenas 5,5 milhões de dólares (R$ 31,6 milhões), em comparação aos 80 milhões de dólares (R$ 460 milhões) investidos em modelos como os da OpenAI. No entanto, alguns analistas indicam que o valor real da empresa chinesa não é conhecido, portanto, não se pode afirmar com certeza que esses números sejam precisos.

O que parece ser mais barato, de fato, é o custo de uso interno, ou seja, o dos tokens. Esse é um conceito difícil de explicar. As IAs funcionam com tokens, que são como fichas de uso pelas quais se paga. O preço de 1 milhão de tokens do modelo que realiza raciocínios é de 55 centavos de dólar, enquanto o modelo 01 da OpenAI cobra 15 dólares pelo mesmo volume. Ou seja, o custo de uso é significativamente mais baixo.

O outro grande modelo é o DeepSeek R1, especializado em raciocínio, que conseguiu alcançar ou até superar o desempenho dos modelos mais avançados da OpenAI em testes essenciais de matemática e programação. Com ele, é a primeira vez que um modelo chinês de código aberto e gratuito se equipara aos líderes ocidentais, rompendo o monopólio do Vale do Silício.

Para citar alguns números, o modelo R1 custou entre 90% e 95% menos para ser desenvolvido em comparação aos seus concorrentes e possui 671 bilhões de parâmetros. Além disso, nos testes matemáticos MATH-500, atingiu uma taxa de acertos de 97,3%, superando os 96,4% dos modelos da OpenAI.

No entanto, há um ponto um tanto polêmico que vale a pena esclarecer: a possível censura do modelo. Assim como o Gemini ou o ChatGPT, o chatbot do DeepSeek também está sujeito aos valores do país onde foi desenvolvido. No caso, ele foi criado na China e segue suas regulamentações, devendo "incorporar valores socialistas fundamentais". Isso significa que ele não responde a perguntas sensíveis sobre política e geopolítica, como questões relacionadas ao Massacre da Praça da Paz Celestial ou à autonomia de Taiwan.

No entanto, essa censura não ocorre no nível do modelo, mas apenas no chatbot online acessível gratuitamente. Ou seja, se você instalar o modelo no seu próprio computador, não terá essas limitações e a IA não estará alinhada com a ideologia do Partido que governa a China.

Como funciona o DeepSeek?

O DeepSeek foi desenvolvido utilizando aprendizado por reforço puro, sem dados previamente rotulados. Essa é uma conquista técnica que, até então, era considerada impossível e que abre novas possibilidades para o treinamento desse tipo de sistema.

Esse aprendizado por reforço permite que o modelo seja capaz de aprender sozinho por meio de tentativa e erro, da mesma forma que uma pessoa pode aprender a andar de bicicleta ou realizar certas tarefas. Isso faz com que o resultado inicial seja mais errático e impreciso, mas o próprio modelo vai descobrindo e desenvolvendo estratégias únicas de raciocínio para continuar aprimorando seu desempenho.

DeepSeek

Depois desse treinamento inicial, o DeepSeek refinou o modelo combinando-o com outros treinamentos supervisionados para aperfeiçoá-lo e criar a versão final do R1. Esse processo manteve o componente de aprendizado autônomo, mas adicionou mais consistência e refinamento ao modelo.

Para o usuário, seu funcionamento é semelhante ao de outros modelos. Há uma tela inicial com um campo de escrita e várias opções de uso, e, ao visualizar os resultados, há uma coluna à esquerda com um histórico de todos os seus chats no DeepSeek.

Para utilizá-lo, basta escrever uma pergunta em linguagem natural, da mesma forma que faria ao conversar com alguém. O DeepSeek então analisará as palavras da sua pergunta para encontrar a melhor resposta, buscando informações na base de dados com a qual foi treinado ou na internet para compor uma resposta também em linguagem natural.

Graças à forma como foi criado, esse modelo consegue compreender contextos complexos em perguntas longas e elaboradas. Além disso, ele pode continuar aprendendo e melhorando. Sua aplicação pode ser usada gratuitamente online ou baixando seu aplicativo móvel, sem a necessidade de assinatura (mas é preciso um cadastro com e-mail e senha).

O que você pode fazer com o DeepSeek

DeepSeek

Com esse modelo de IA, você pode fazer praticamente tudo o que outros modelos oferecem. Ele responde em tempo real a qualquer tipo de pergunta, seja sobre personagens famosos, lugares ou significados de conceitos, entre muitas outras possibilidades.

Também pode explicar temas complexos de maneira simples, desde que você peça. Além disso, é possível enviar documentos para que ele extraia informações-chave e responder a perguntas relacionadas ao seu conteúdo.

O DeepSeek também é útil para programação, permitindo escrever ou depurar código, além de resolver problemas matemáticos. Se você for criador de conteúdo, pode usá-lo para gerar ideias, textos, compor poesias ou criar templates e estruturas para artigos. Ele também pode revisar e corrigir textos.

Na caixa onde você escreve seu prompt ou pergunta, há três botões. O botão de clipe permite anexar arquivos. Já o botão "DeepThink R1" faz com que a IA analise a resposta anterior ou o contexto da conversa para fornecer uma resposta mais elaborada. Por fim, o botão "Search" permite buscar informações na internet, apresentando as fontes antes da resposta.

Além disso, em cada resposta gerada, há opções para copiar o texto, avaliar a resposta positivamente ou negativamente conforme a qualidade, e um botão para recarregar a resposta, gerando uma nova versão baseada no mesmo prompt.

Este texto foi traduzido/adaptado do site Xataka Espanha.

Inicio