As IAs mais famosas do mercado conseguem responder em português, mas algumas são superiores em tarefas específicas sobre o Brasil, incluindo conhecimentos gerais e legislação. Para descobrir a melhor, é possível acessar um ranking que avalia o desempenho dos LLMs em temas nacionais.
- CEO de IA brasileira defende criação de infraestrutura nacional da tecnologia
- GAIA, Amazônia e mais: 5 IAs generativas brasileiras
O Open Portuguese LLM Leaderboard foi criado pelo pesquisador de IA Eduardo Garcia, vinculado ao Centro de Excelência em Inteligência Artificial (CEIA) da Universidade Federal de Goiás (UFG).
O teste usa nove critérios diferentes para avaliar qual é a melhor IA para tarefas sobre o Brasil, incluindo desempenho na prova do Exame Nacional do Ensino Médio (Enem), no exame da Ordem dos Advogados do Brasil (OAB), provas de vestibulares, avaliações sobre similaridade semântica e até uma lista de posts no X por brasileiros.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
A seguir, veja o top 10:
Melhores modelos de IA em teste de português
O teste tem resultados atualizados até abril deste ano. Considerando esse recorte, as melhores opções são:
- Gemini 2.5 Pro Experimental (Google)
- Claude 3.7 Sonnet (Anthropic)
- GPT-4o (OpenAI)
- Sabiá-3 (Maritaca AI)
- Gemini 2.0 Flash (Google)
- Llama 3.1 (Meta)
- DeepSeek-V3-0324 (DeepSeek)
- Qwen 2.5-72B-Instruct (Qwen)
- Qwen 2.5-VL-32B-Instruct (Qwen)
- Qwen/Qwen2.5-72B-Instruct [4bit] (Qwen)
Vale ressaltar que a lista não é atualizada desde abril de 2025, então alguns modelos mais recentes estão de fora. É o caso de Gemini 2.5 Flash, GPT-5 e Grok 4, por exemplo.

Quais são as melhores IAs de forma geral?
Não existe um único jeito de avaliar o desempenho de um modelo de IA, principalmente pela quantidade de tarefas que eles podem fazer. Algumas plataformas de benchmark podem servir de parâmetro com direito a testes e rankings atualizados.
Um deles é feito pela empresa Artificial Analysis, que faz uma média a partir de oito testes diferentes para nomear os mais inteligentes. Nesse caso, os melhores são (resultados de agosto de 2025):
- GPT-5 (high) (OpenAI)
- GPT-5 (medium) (OpenAI)
- Grok 4 (xAI)
- o3 (OpenAI)
- o4-mini (high) (OpenAI)
- Gemini 2.5 Pro (Google)
- Qwen3-235B-2507 (Reasoning) (Qwen)
- GPT-oss-120B (high) (OpenAI)
- Claude 4 Sonnet (Thinking) (Anthropic)
- DeepSeek R1 0528 (DeepSeek)
Outra opção é a plataforma LMArena, que funciona como um “teste cego” — a comunidade faz um prompt, recebe dois resultados diferentes (sem saber quais modelos foram usados) e escolhe o melhor.
As principais IAs de texto nesse sentido são (consulta em agosto de 2025):
- GPT-5 (high) (OpenAI)
- Gemini 2.5 Pro (Google)
- Claude Opus 4.1 (Thinking) (Anthropic)
- Claude Opus 4.1 (Anthropic)
- o3 (OpenAI)
- GPT-4o (OpenAI)
- GPT-4.5 (OpenAI)
- Grok 4 (xAI)
- GPT-5 (chat) (OpenAI)
- Qwen 3-235B (Qwen)
Leia também:
- Testes de inteligência e mais: como funcionam os benchmarks de IA
- Mais de R$ 1 mil por mês: por que há planos de IA que custam uma fortuna?
- O que é ChatGPT Go? Entenda como funciona o novo plano mais barato da IA
VÍDEO: qual IA escolher?
Leia a matéria no Canaltech.