9 de junho de 2025

Inteligência Artificial: Com qual ferramenta eu vou?

Avelino segurando um microfone e uma camiseta preta escrita Agile. Ele é pardo, barba e cabelos grisalhos.

Avelino Ferreira Gomes Filho

Compartilhe:

As ferramentas de Inteligência Artificial (IA) já são uma realidade. Todavia, como saber qual escolher. Neste artigo quero apresentar os atuais modelos de IA que temos disponíveis para te ajudar nessa escolha. Antes vamos a alguns avisos importantes

1. A atualização delas é constante e esse texto deve ficar defasado logo, logo. Veja a data de publicação.

2. Elaborei esse artigo questionando cada uma das ferramentas. Nem sempre as respostas foram as melhores imaginadas. Por exemplo, o ChatGPT ignorou seus próprios modelos. O Copilot da Microsoft deu respostas extremamente evasivas e me obrigou a olhar outras fontes.

Outro ponto importante que eu gostaria de deixar são os conceitos que acredito que são relevantes para que entendamos essa leva de ferramentas que estão logo no início deste texto.

Conceitos relevantes aplicados às ferramentas de IA

Inteligência Artificial Generativa (AI Gen)

O lançamento do ChatGPT nos abriu uma porta para novas oportunidades. Ele e muitas outras ferramentas são exemplos de Inteligência Artificial Generativa. Ela é um ramo da IA focado na criação de novos conteúdos a partir de dados existentes, utilizando modelos de redes neurais profundas. Ela é capaz de gerar textos, imagens, músicas, códigos e até vídeos de maneira autônoma, imitando padrões aprendidos durante o treinamento. Embora impressione pela capacidade de criar conteúdos complexos e variados, a IA generativa não entende o que produz — ela apenas reconhece e reproduz padrões estatísticos.

É importante não confundir com Inteligência Artificial Geral, pois a sigla é idêntica tanto em inglês quanto português. A IA Geral seria a inteligência capaz de simular totalmente o humano. Ela conseguiria não só compreender tanto o conteúdo consumido quanto o produzido, como também seria capaz de fazer abstrações. Além disso, ela será capaz de aprender de forma autônoma e se adaptar a contextos desconhecidos. Até o momento não há uma IA Geral publicamente conhecida.

Large Language Model (LLM)

Um LLM (Large Language Model) é um modelo de inteligência artificial treinado com enormes quantidades de informações para entender e gerar linguagem humana de forma fluente. Ele aprende padrões, estrutura gramatical, significado de palavras e contextos para conseguir responder perguntas, escrever textos, traduzir idiomas, gerar códigos etc. Apesar de parecer que “entende”, um LLM não tem consciência nem conhecimento real — ele prevê a resposta com base em probabilidades aprendidas durante o seu treinamento.

Multimodalidade

Multimodalidade é a capacidade de uma IA de processar e gerar mais de um tipo de dado, como: texto, imagem, áudio, vídeo, código-fonte e comandos interativos (ex: cliques, movimentos). A IA pode entender e combinar diferentes formas de entrada (ex: imagem + texto) e gerar saídas variadas, como descrever uma imagem, responder perguntas sobre um gráfico, transformar uma fala em texto, etc.

Comparação das Inteligências Artificiais

IA	Desenvolvedor	Pontos Fortes Principais	Para Quem é Ideal
ChatGPT	OpenAI	Respostas naturais e fluentes, versátil, planos gratuitos e pagos, criação de vídeos	Usuários que querem um assistente geral criativo e fácil de usar
Gemini	Google DeepMind	Integração com Google, multimodal (texto, voz, imagem), respostas estruturadas	Usuários que usam serviços Google e querem produtividade integrada
Copilot	Microsoft/GitHub	Focado em programação, integração com Microsoft 365, criação de documentos e análise de dados	Desenvolvedores e profissionais que usam ferramentas Microsoft
DeepSeek	DeepSeek (China)	Organização das respostas, bom raciocínio, destaque em análises especializadas	Pesquisadores e quem precisa de análises detalhadas e específicas
Grok	xAI (Elon Musk/𝕏)	Tom descontraído, coleta informações em redes sociais, atualizações em tempo real	Usuários que querem um assistente com personalidade e informação atual. Também se demonstra uma excelente opção para criadores de produtos digitais.
Claude	Anthropic	Foco em ética, segurança, respostas longas e coerentes	Empresas e usuários que priorizam segurança e confiabilidade, além de desenvolvedores de software.
Perplexity	Perplexity AI	Respostas precisas com fontes, busca em tempo real, multimodal	Usuários que precisam de respostas rápidas, precisas e com referências confiáveis

OpenAI ChatGPT

Desenvolvido pela OpenAI, o ChatGPT é um dos modelos de linguagem populares e utilizados no mundo. Ele é capaz de gerar textos, responder perguntas, auxiliar em tarefas diversas e até interagir com imagens, dependendo da versão utilizada.

GPT-3.5 Turbo

Primeiro tem o GPT-3.5 Turbo, que é bem rápido e leve. Ele resolve aquelas coisas do cotidiano sem complicação: responder dúvidas rápidas, ajudar em tarefas mais simples, dar sugestões rápidas. Como ele é ágil e usa menos recurso, funciona muito bem quando não precisa de uma resposta super detalhada, mas quer agilidade.

GPT-4

Depois vem o GPT-4, que já é mais robusto, mais preciso e com mais capacidade de compreensão. Ele entende contextos mais complexos, interpreta melhor nuances, e as respostas são mais detalhadas e precisas. É ideal quando o assunto é técnico ou quando você precisa confiar mais na profundidade e exatidão da resposta.

GPT-4.5

Já o GPT-4.5 é uma versão intermediária que fica entre o GPT-4 e o GPT-4o. Ele entrega respostas detalhadas e precisas como o GPT-4, mas com algumas melhorias, principalmente no desempenho, mantendo conversas mais longas, interpretando melhor contextos amplos e sendo mais assertivo ao acompanhar o diálogo. É tipo um GPT-4 “turbinado”, só que ainda não entende imagens. Ele é ótimo quando você precisa de qualidade avançada, com um equilíbrio bom entre velocidade e detalhamento, especialmente em conversas mais extensas ou mais técnicas.

GPT-4.1e GPT-4.1-mini

Tem também algumas versões intermediárias que você pode encontrar, como o GPT-4.1 e GPT-4.1-mini. Essas versões entregam um bom equilíbrio entre velocidade e detalhamento, com um desempenho superior ao GPT-3.5 Turbo e próximas do GPT-4, sendo ideais para conversas médias ou curtas, onde é preciso rapidez, mas também qualidade.

Ominis “o”

Outro conjunto de versões são as que começam com “o”, como a o4-mini-high e a o4-mini. São versões reduzidas e mais rápidas do GPT-4o, ou seja, já conseguem trabalhar com imagens e texto juntos (multimodais), mas são mais leves e ágeis, ideais para tarefas simples ou rápidas que envolvem imagens.

E ainda tem a o3, que é uma versão intermediária multimodal mais leve, um meio-termo entre a simplicidade do GPT-3.5 e a capacidade visual avançada do GPT-4o. Ela é boa para pequenas tarefas visuais, mas sem a necessidade da profundidade do GPT-4o.

GPT-4o

Por último, tem o GPT-4o, que é a versão mais recente e poderosa, que inclusive entende imagens, reconhece objetos, lê gráficos e tabelas visuais. É como se tivesse olhos! É especialmente útil quando precisa analisar imagens ou documentos visuais, ou em contextos mais avançados que envolvem multimodalidade (combinação de texto e imagem). Além disso, tem a velocidade do GPT-3.5 e o raciocínio avançado do GPT-4, juntando o melhor dos dois mundos.

Resumo do ChatGPT

Para rapidez e simplicidade, GPT-3.5 Turbo.
Para complexidade e precisão em textos, GPT-4.
Se precisar ainda mais contexto e desempenho em diálogos longos, GPT-4.5.
Para equilíbrio rápido entre qualidade e precisão, GPT-4.1 e GPT-4.1-mini.
Para tarefas leves com imagens, versões o4-mini e o4-mini-high.
Para multimodalidade leve, a versão o3.
E quando precisar do que há de mais avançado, inclusive interpretação visual, GPT-4o.

Escrito com auxílio do próprio ChatGPT

Google Gemini

O Gemini é a família de modelos de Inteligência Artificial desenvolvida pelo Google. Focado na integração com os serviços da empresa, combina velocidade, raciocínio e personalização com base no histórico do usuário, sendo uma opção versátil para tarefas personalizadas.

2.5 Flash

Este modo é descrito como “Fast all-around help” (Ajuda rápida para tudo). Isso indica que o 2.5 Flash é a versão mais leve e otimizada para velocidade. Ele é ideal para tarefas rápidas e gerais que exigem respostas imediatas, como perguntas simples, resumos rápidos ou brainstorms ágeis, priorizando a agilidade na interação.

2.5 Pro

Denominado “Reasoning, math & code” (Raciocínio, matemática e código), este modo sugere uma capacidade de processamento mais robusta e avançada. O 2.5 Pro é projetado para lidar com tarefas mais complexas, que exigem raciocínio aprofundado, resolução de problemas matemáticos, geração ou depuração de código.

Personalization

Esta opção, “Based on your Search history” (Baseado no seu histórico de pesquisa), não é um modelo diferente, mas sim uma funcionalidade que personaliza a experiência com o Gemini. Ao ativá-la, o Gemini pode usar seu histórico de pesquisa para fornecer respostas mais relevantes e adaptadas aos seus interesses e ao seu contexto, tornando as interações mais úteis e individualizadas.

Escrito com auxílio do próprio Gemini

Anthropic Claude

Criado pela Anthropic, Claude é um modelo de linguagem que se destaca pelo equilíbrio entre segurança, qualidade de respostas e eficiência. Ele é pensado para fornecer interações mais alinhadas com valores éticos e uma linguagem mais cuidadosa. Se você desenvolve software, essa é a sua ferramenta.

Um dia eu estava no metrô e tive uma ideia para um de nossos software. Queria ver como ficaria, passei o link de uma outra aplicação nossa para o Claude para ele entender a identidade visual. Escrevi a minha ideia e pedi para ele separar estilo (Css), Javascript (js) do HTML. Quando cheguei no computador foi só dar Ctrl+C e Ctrl+V. Alguns pequenos ajustes para a identidade e voilà! Tudo criado em menos de 5 minutos.

Claude Sonnet 4

É o modelo inteligente e eficiente projetado para uso cotidiano, oferecendo um excelente equilíbrio entre capacidade e velocidade de resposta. Escolha o Sonnet 4 quando precisar de um assistente versátil para tarefas como escrita, análise, programação, resolução de problemas e conversas gerais – ele é rápido, confiável e capaz de lidar com a maioria das demandas do dia a dia de forma eficiente.

Claude Opus 4

Por enquanto, disponível apenas via API. É a versão mais avançada e poderosa da família Claude 4, com capacidades superiores para raciocínio complexo e tarefas sofisticadas. Escolha o Opus 4 quando enfrentar desafios que exigem o máximo de capacidade analítica, como análises profundas, resolução de problemas complexos, pesquisa avançada ou quando a qualidade da resposta é mais importante que a velocidade – ideal para trabalhos profissionais que demandam excelência.

Claude Code

Disponível via linha de comando. É uma ferramenta agentica em preview de pesquisa que permite delegar tarefas de programação diretamente do terminal. Escolha o Claude Code quando quiser integrar a assistência de IA diretamente no seu fluxo de trabalho de desenvolvimento, automatizando tarefas de codificação e permitindo que o Claude trabalhe nos seus projetos de forma mais integrada ao ambiente de desenvolvimento.

Escrito com o auxílio do próprio Claude.

Microsoft Copilo, Grok 3 e DeepSeek V3

O Copilot é a interface da Microsoft para integração de IA em seus produtos, como Word, Excel, e Visual Studio. Não tem uma confirmação de que ainda é assim, mas suas versões iniciais eram baseados em modelos da OpenAI.

Já o Grok é o modelo desenvolvido pela xAI, empresa de Elon Musk. Ele foi criado para ser integrado ao X (antigo Twitter), com foco em fornecer respostas rápidas e diretas, embora sua arquitetura e capacidades detalhadas ainda sejam pouco divulgadas.

DeepSeek é uma iniciativa chinesa que tem como diferencial a liberação de seu código-fonte. Você pode baixar e rodar na sua infraestrutura. Todavia, se prepare para ter uma senhora infraestrutura para rodar.

Esses três não disponibilizam multimodelos. Cada um possui sua versão específica. Os modelos da Microsoft e o Grok da xAI não dão muitos detalhes sobre suas implementações.

Perplexity

O Perplexity AI não possui modelos próprios exclusivos para todas as suas funcionalidades; ele utiliza uma combinação de modelos de linguagem de terceiros, como GPT-4 da OpenAI, Claude 3 da Anthropic, Mistral Large, Llama 3, além de seus próprios modelos internos chamados pplx-7b e pplx-70b, que são desenvolvidos e ajustados pela própria Perplexity para otimizar desempenho e integração com seu mecanismo de busca. Assim, o Perplexity funciona como uma plataforma que agrega e gerencia vários LLMs, combinando-os com pesquisa em tempo real na web para fornecer respostas atualizadas, precisas e contextualizadas, mas não depende exclusivamente de um modelo próprio único.

Conclusão

Em um cenário em rápida evolução, entender as capacidades e limitações dos modelos de IA é essencial para fazer escolhas conscientes. Embora cada ferramenta tenha seu ponto forte, o mais importante é alinhar suas necessidades com as capacidades do modelo. E lembre-se: nenhuma IA substitui o pensamento crítico humano.

Quer saber como a IA pode te ajudar a criar produtos incríveis, dá uma olhadinha no nosso treinamento de…

🚀 Product AI

Hasta la vista!

Sobre o autor(a)

Avelino Ferreira Gomes Filho

Trainer na K21

Avelino Ferreira é formado e mestre em Ciência da Computação. Teve uma longa trajetória na TI, começando como programador e chegando a gestor de diversos times de criação de produtos digitais. Conheceu e começou a adotar as melhores prática de de Métodos Ágeis em 2008. Desde então, se dedica a auxiliar outras empresas na construção da cultura ágil. Atualmente, é Consultor e Trainer na K21

Artigos e notícias

Sobre o que você
quer aprender hoje?

Escalar Agilidade? O Custo Oculto de Conway que Ninguém te Conta

Muitas empresas que passam por transformações ágeis já querem começar utilizando Métodos Ágeis em escala. Para tal, adotam frameworks como SAFe e outros. Entretanto, trabalhar em escala pode ser difícil e complexo, pois todos os problemas que ainda não foram…

Avelino Ferreira Gomes Filho

Como Lidar com Demandas com Prazo: Uma Abordagem Baseada em Dados e Kanban

Todos nós recebemos demandas que têm um prazo exato para ser entregue. Quando isso acontece, uma das ações acaba sendo tomadas. A primeira é parar tudo e começar a fazer a demanda com prazo. Outra, caso o prazo esteja distante,…

Avelino Ferreira Gomes Filho

Lei de Little (Little’s Law): A Ciência por Trás de Fazer Menos e Entregar Mais

A Lei de Little vem do professor do MIT John D. C. Little (1928 – 2024). Ele publicou o conceito inicial em 1954 sobre a Teoria das Filas e o comprovou em 1960 no artigo que pode ser lido na…

Avelino Ferreira Gomes Filho

Tratando Riscos em Projetos Ágeis : Riscos de Negócio

Tratando Riscos em Projetos Ágeis : Riscos de Negócio Há alguns dias estava lendo um artigo do Kanban Plus e esbarrei no tratamento de riscos que o Kanban traz. Senti vontade de dar um passo além e escrever como tratamos…

Inteligência Artificial: Com qual ferramenta eu vou?

Conceitos relevantes aplicados às ferramentas de IA