Qual é a melhor IA em português? Teste avalia conhecimentos do Brasil

As IAs mais famosas do mercado conseguem responder em português, mas algumas são superiores em tarefas específicas sobre o Brasil, incluindo conhecimentos gerais e legislação. Para descobrir a melhor, é possível acessar um ranking que avalia o desempenho dos LLMs em temas nacionais.

O Open Portuguese LLM Leaderboard foi criado pelo pesquisador de IA Eduardo Garcia, vinculado ao Centro de Excelência em Inteligência Artificial (CEIA) da Universidade Federal de Goiás (UFG).

O teste usa nove critérios diferentes para avaliar qual é a melhor IA para tarefas sobre o Brasil, incluindo desempenho na prova do Exame Nacional do Ensino Médio (Enem), no exame da Ordem dos Advogados do Brasil (OAB), provas de vestibulares, avaliações sobre similaridade semântica e até uma lista de posts no X por brasileiros.

–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–

A seguir, veja o top 10:

Melhores modelos de IA em teste de português

O teste tem resultados atualizados até abril deste ano. Considerando esse recorte, as melhores opções são:

Gemini 2.5 Pro Experimental (Google)
Claude 3.7 Sonnet (Anthropic)
GPT-4o (OpenAI)
Sabiá-3 (Maritaca AI)
Gemini 2.0 Flash (Google)
Llama 3.1 (Meta)
DeepSeek-V3-0324 (DeepSeek)
Qwen 2.5-72B-Instruct (Qwen)
Qwen 2.5-VL-32B-Instruct (Qwen)
Qwen/Qwen2.5-72B-Instruct [4bit] (Qwen)

Vale ressaltar que a lista não é atualizada desde abril de 2025, então alguns modelos mais recentes estão de fora. É o caso de Gemini 2.5 Flash, GPT-5 e Grok 4, por exemplo.

Modelo do Gemini liderou teste em português (Imagem: Marcelo Salvatico/Canaltech)

Quais são as melhores IAs de forma geral?

Não existe um único jeito de avaliar o desempenho de um modelo de IA, principalmente pela quantidade de tarefas que eles podem fazer. Algumas plataformas de benchmark podem servir de parâmetro com direito a testes e rankings atualizados.

Um deles é feito pela empresa Artificial Analysis, que faz uma média a partir de oito testes diferentes para nomear os mais inteligentes. Nesse caso, os melhores são (resultados de agosto de 2025):

GPT-5 (high) (OpenAI)
GPT-5 (medium) (OpenAI)
Grok 4 (xAI)
o3 (OpenAI)
o4-mini (high) (OpenAI)
Gemini 2.5 Pro (Google)
Qwen3-235B-2507 (Reasoning) (Qwen)
GPT-oss-120B (high) (OpenAI)
Claude 4 Sonnet (Thinking) (Anthropic)
DeepSeek R1 0528 (DeepSeek)

Outra opção é a plataforma LMArena, que funciona como um “teste cego” — a comunidade faz um prompt, recebe dois resultados diferentes (sem saber quais modelos foram usados) e escolhe o melhor.

As principais IAs de texto nesse sentido são (consulta em agosto de 2025):

GPT-5 (high) (OpenAI)
Gemini 2.5 Pro (Google)
Claude Opus 4.1 (Thinking) (Anthropic)
Claude Opus 4.1 (Anthropic)
o3 (OpenAI)
GPT-4o (OpenAI)
GPT-4.5 (OpenAI)
Grok 4 (xAI)
GPT-5 (chat) (OpenAI)
Qwen 3-235B (Qwen)

Leia também:

VÍDEO: qual IA escolher?

Leia a matéria no Canaltech.

Qual é a melhor IA em português? Teste avalia conhecimentos do Brasil

Melhores modelos de IA em teste de português

Quais são as melhores IAs de forma geral?

Categorias

Links Importantes

Recentes

Melhores modelos de IA em teste de português

Quais são as melhores IAs de forma geral?

Veja mais:

Roku Stick chega ao Brasil: nova “mini TV Box” quer desbancar rival da Amazon

Privacidade avançada do WhatsApp remove o Meta AI? Entenda

Quanto custaria um Tamagotchi hoje, corrigido pela inflação?