Qual é a melhor IA em português? Teste avalia conhecimentos do Brasil

Tecnologia

As IAs mais famosas do mercado conseguem responder em português, mas algumas são superiores em tarefas específicas sobre o Brasil, incluindo conhecimentos gerais e legislação. Para descobrir a melhor, é possível acessar um ranking que avalia o desempenho dos LLMs em temas nacionais.

O Open Portuguese LLM Leaderboard foi criado pelo pesquisador de IA Eduardo Garcia, vinculado ao Centro de Excelência em Inteligência Artificial (CEIA) da Universidade Federal de Goiás (UFG). 

O teste usa nove critérios diferentes para avaliar qual é a melhor IA para tarefas sobre o Brasil, incluindo desempenho na prova do Exame Nacional do Ensino Médio (Enem), no exame da Ordem dos Advogados do Brasil (OAB), provas de vestibulares, avaliações sobre similaridade semântica e até uma lista de posts no X por brasileiros.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

A seguir, veja o top 10:

Melhores modelos de IA em teste de português

O teste tem resultados atualizados até abril deste ano. Considerando esse recorte, as melhores opções são:

  1. Gemini 2.5 Pro Experimental (Google)
  2. Claude 3.7 Sonnet (Anthropic)
  3. GPT-4o (OpenAI)
  4. Sabiá-3 (Maritaca AI)
  5. Gemini 2.0 Flash (Google)
  6. Llama 3.1 (Meta)
  7. DeepSeek-V3-0324 (DeepSeek)
  8. Qwen 2.5-72B-Instruct (Qwen)
  9. Qwen 2.5-VL-32B-Instruct (Qwen)
  10. Qwen/Qwen2.5-72B-Instruct [4bit] (Qwen)

Vale ressaltar que a lista não é atualizada desde abril de 2025, então alguns modelos mais recentes estão de fora. É o caso de Gemini 2.5 Flash, GPT-5 e Grok 4, por exemplo.

Modelo do Gemini liderou teste em português (Imagem: Marcelo Salvatico/Canaltech)

Quais são as melhores IAs de forma geral?

Não existe um único jeito de avaliar o desempenho de um modelo de IA, principalmente pela quantidade de tarefas que eles podem fazer. Algumas plataformas de benchmark podem servir de parâmetro com direito a testes e rankings atualizados.

Um deles é feito pela empresa Artificial Analysis, que faz uma média a partir de oito testes diferentes para nomear os mais inteligentes. Nesse caso, os melhores são (resultados de agosto de 2025):

  1. GPT-5 (high) (OpenAI)
  2. GPT-5 (medium) (OpenAI)
  3. Grok 4 (xAI)
  4. o3 (OpenAI)
  5. o4-mini (high) (OpenAI)
  6. Gemini 2.5 Pro (Google)
  7. Qwen3-235B-2507 (Reasoning) (Qwen)
  8. GPT-oss-120B (high) (OpenAI)
  9. Claude 4 Sonnet (Thinking) (Anthropic)
  10. DeepSeek R1 0528 (DeepSeek)

Outra opção é a plataforma LMArena, que funciona como um “teste cego” — a comunidade faz um prompt, recebe dois resultados diferentes (sem saber quais modelos foram usados) e escolhe o melhor.

As principais IAs de texto nesse sentido são (consulta em agosto de 2025): 

  1. GPT-5 (high) (OpenAI)
  2. Gemini 2.5 Pro (Google)
  3. Claude Opus 4.1 (Thinking) (Anthropic)
  4. Claude Opus 4.1 (Anthropic)
  5. o3 (OpenAI)
  6. GPT-4o (OpenAI)
  7. GPT-4.5 (OpenAI)
  8. Grok 4 (xAI)
  9. GPT-5 (chat) (OpenAI)
  10. Qwen 3-235B (Qwen)

Leia também:

VÍDEO: qual IA escolher?

Leia a matéria no Canaltech.