Reflexão sobre as provas de avaliação externa | 2025

A Associação de Professores de Português mostra, nesta reflexão que incorpora um conjunto de recomendações finais, que há uma tendência crescente para a predominância de itens de seleção nas provas de avaliação externa e que essa tendência se intensificou com a migração da avaliação externa para plataformas digitais, a que acresce o formato das provas numa plataforma que não permite que os alunos usem algumas das competências que aprenderam para lerem um texto em maior profundidade e para planificarem bem e textualizarem os itens de construção.

Neste contexto, a APP realizou, no dia 30 de outubro, por videoconferência, um Debate | APP que contou com mais de 120 participantes e a intervenção, rigorosa, clara e detalhada, de dois especialistas em avaliação externa e de uma investigadora em neurociência cognitiva – e cujos PPT de apoio à comunicação serão partilhados em breve com todos os inscritos na ACD.

Na introdução ao Debate, o presidente da direção citou algumas das conclusões e das recomendações desta Reflexão:

 

 

Reflexão sobre as provas de avaliação externa | 2025

 

O parecer sobre o Exame Final Nacional de Português, código 639, de 2025, reconhece que, apesar de avaliar conhecimentos, capacidades e competências previstos nos documentos curriculares de referência, nomeadamente nas AE, ter uma extensão adequada e uma exigência medianamente elevada, e ser uma prova adequada para o nível etário e cognitivo dos alunos, esse exame valoriza em excesso os itens de seleção e apresenta um modelo que, pese embora o rigor científico, não tem níveis elevados de complexidade cognitiva (apenas 4/15 (26,7%) são itens de maior complexidade, no total da prova).

Por outro lado, e à imagem do que já dizíamos em 2021, o exame está organizado na perspetiva de que os alunos, que estavam então a viver num contexto pandémico, continuem a ser sujeitos a uma avaliação que era nesse contexto o mais equitativa possível, prevendo, assim, alguns itens de resposta facultativa, tal como é dito na primeira página da prova ainda em 2025: «A prova inclui 10 itens […] cujas respostas contribuem obrigatoriamente para a classificação final. Dos restantes 5 itens da prova, apenas contribuem para a classificação final os 3 itens cujas respostas obtenham melhor pontuação.»

Por isso, a APP recomenda que, no caso das provas em papel, se crie um maior equilíbrio entre os itens de seleção e os de construção – em 2019, antes da pandemia, os itens de construção totalizavam 46,7% da prova (vs. 40% a partir de 2020) e os itens de seleção perfaziam 56/200 pontos da prova (vs. 91/200 pontos a partir de 2020), mas mantendo sempre o rigor científico e uma extensão e exigência adequadas para o nível etário em provas calibradas com níveis elevados de complexidade cognitiva.

Se considerarmos as 14 provas que foram objeto de auditoria pela APP, em 2025 – de Português, Português Língua Segunda, PLNM e Literatura Portuguesa –, constatamos que apenas 4 foram em papel [todas correspondentes a Exames Finais Nacionais (EFN), de Português (639), Português Língua Segunda (138), PLNM – nível B1 (839), Literatura Portuguesa (734)], sendo as restantes 10 provas (71,4%) em formato digital, provas que este ano abrangeram todo o universo das provas ModA [(Português, 4.º e 6.º ano (41 e 61); Português Língua Segunda, 4.º e 6.º ano (44 e 62); PLNM, A2, 4.º e 6.º ano (43 e 63)], as provas finais do 3.º ciclo de Português (91), as de PLNM, A2 e B1 (93 e 94) e Português L2 (95).

Todas estas 10 provas em formato digital, das quais 60% correspondem à provas ModA, deixaram de ser públicas. Se consultarmos as de 2024, e analisando sobretudo as Provas Finais de Ciclo (PFC), constatamos que:

i. Português (91): A prova tem 17/21 itens de seleção (80,9%), que correspondem a 68/100 pontos. Todos os itens de seleção têm a mesma pontuação (4 pontos), sendo todos de escolha múltipla.

ii. PLNM, A2 e B1 (93 e 94): As provas têm 15/17 itens de seleção (88,2%) na componente escrita (há uma componente de interação oral), que correspondem a 60/85 pontos. Todos os itens de seleção valem 4 ou 5 pontos.

iii. Português L2 (95): A prova tem 16/19 itens de seleção (84,2%), que correspondem a 70/100 pontos. Todos os itens de seleção têm a mesma pontuação (5 pontos).

De facto, em Português L2, o recurso à escrita verifica-se em dois itens de construção – um item de resposta curta e um de resposta extensa –, na prova 82 [prova de aferição]; dois itens de resposta curta e um de resposta extensa, na prova 95; e quatro itens de resposta curta e um de resposta extensa, na prova 138 (EFN) – o que perfaz, no total de 12 itens da prova do 12.º ano, uma percentagem de 41,7% de itens de construção (vs. 40% no caso da prova 639, também do 12.º). É na escrita que o aluno surdo reconhece e aplica as regras gramaticais em contextos significativos e aperfeiçoa a comunicação de pontos de vista, emoções, distância crítica e humor. Está assim equilibrada a progressão, entre as provas do básico e do secundário, o que também se pressupõe na aprendizagem da disciplina de PL2.

 

No caso da prova 91, o parecer da APP defendia que «Tendo em conta a presença de quase 81% de itens de seleção, com um peso de 68/100 pontos, podemos sugerir que, nos próximos anos, haja um maior equilíbrio entre os itens de seleção e os de construção, nas provas finais de ciclo, mas mantendo sempre, naturalmente, o rigor científico e uma extensão e exigência adequadas para o nível etário em provas calibradas com níveis elevados (e exemplares) de complexidade cognitiva.»

 

Esta análise mostra que há uma tendência crescente para a predominância de itens de seleção nas provas de avaliação externa — tanto nas provas de fim de ciclo como nos exames finais nacionais, tendência que se intensificou com a migração da avaliação externa para plataformas digitais, que em 2025 representaram 71,4% de todas as provas que foram auditadas pela APP.

De facto, essa prevalência parece-nos excessiva e atinge, como vimos, 60% no caso do exame final nacional do 12.º ano – e atingia ainda, em 2024, 80,9% no caso da PFC do 9.º ano e valores entre 84% e 88% nas provas de PL2 e PLNM (o que agora fica ‘escondido’, entre outras, nas provas ModA e na prova final de ciclo, no 9.º ano, que não são públicas), a que acresce o formato das provas numa plataforma digital que não permite que os alunos usem algumas das competências que aprenderam para lerem um texto em maior profundidade e para planificarem bem e textualizarem os itens de construção.

Esta afirmação apresenta três constatações subentendidas que devemos explicitar:

i. A prevalência excessiva de itens de seleção, ainda que rigorosos e bem construídos, inclui itens não obrigatórios, que faziam sentido num contexto pós-pandémico, mas que agora deixaram de fazer sentido e introduzem um acréscimo de aleatoriedade (um acréscimo não mensurável de ‘respostas ao acaso’ dos alunos, por não dominarem a matéria, haver erros de interpretação ou de compreensão, ou outros problemas). O problema é que não conseguimos distinguir a razão do falhanço – foi aleatório ou por confusão ou erro do aluno? E, para dois alunos com a mesma classificação final, há uma diferença escondida entre o aluno que resolveu bem toda a prova e o aluno que falhou em itens que não contaram para a classificação final, o que introduz um enviesamento e uma perda não mensurável da validade da prova na comparação entre os alunos.

ii. O caráter não público da PFC de Português, no 9.º ano, que conta para a classificação final dos alunos, introduz uma opacidade que entra em contradição com o princípio da transparência na avaliação. Apesar de ser uma prova de avaliação sumativa, é importante os alunos terem acesso ao resultado do esforço do seu trabalho e estudo e poderem refletir, juntamente com os seus professores, acerca do que fizeram menos bem e aprenderem com essa reflexão – há certamente uma dimensão formativa na avaliação externa que é importante e que se perde completamente com esta opacidade, que não permite também que os alunos possam ter o direito de apresentar um recurso relativamente a todos os itens da prova, e não apenas àqueles que são de seleção ou que o sistema pré-determina que devem ser revistos, por haver uma discrepância estatística nos resultados obtidos.

iii. Em 2024, o facto de a prova não ter sido realizada em formato eletrónico permitiu que os alunos utilizassem competências específicas da disciplina de Português, com implicações positivas em ações estratégicas decisivas, como é o caso das técnicas de leitura de textos associadas a técnicas de escrita (sublinhados, esquemas, notas na margem…). De facto, as ferramentas disponíveis no formato eletrónico continuam a penalizar os alunos ao não permitir que possam sublinhar ou fazer esquemas para destacar a informação que considerem pertinente (nos textos ou no enunciado dos itens da prova) e assim responderem melhor às questões apresentadas. Por outro lado, a planificação da produção escrita no item de construção de resposta extensa realiza-se mais facilmente com papel e caneta – não se correndo, assim, o risco de incentivarmos a escrita de textos ‘não planificados’ e tendencialmente mais curtos, como tende a acontecer na escrita em computador. Este desafio tecnológico, a que a plataforma do IAVE não respondeu ainda até 2025, é muito importante para um maior sucesso na realização de provas como a de Português, se continuar a ser retomado o modelo das provas em formato eletrónico.

 

Desta análise, resulta a seguinte recomendação final para a avaliação externa das provas de Português:

 

i. Deve haver um número menor de itens de seleção, reduzindo para um máximo de 50/200 pontos (atualmente, valem 91 pontos na prova 639 e correspondem a 60% dos 15 itens da prova ou 7/13=53,8% dos itens que contam para a classificação final).

ii. Todos os itens devem ser obrigatórios, deixando de haver itens cujas respostas não contribuem para a classificação final.

iii. Não deve haver uma dupla penalização na pontuação dos itens, atribuindo mais pontos aos que são potencialmente mais complexos ou difíceis.

iv. Os itens de construção devem valer mais do que os de seleção[1].

v. Uma vez que a avaliação externa compromete o ato cognitivo associado à escrita manual, a plataforma digital em que se realizam as provas de Português (e das outras disciplinas cuja auditoria é realizada pela APP) deve salvaguardar as ações estratégicas decisivas para um bom desempenho nessas disciplinas, permitindo que os alunos possam sublinhar, fazer esquemas, escrever notas na margem ou, quanto à escrita, nomeadamente nos itens de resposta extensa, planificar previamente os seus textos e permitir ferramentas robustas de edição – ou, em alternativa, permitir que a prova tenha um formato híbrido e que o item de construção de uma resposta extensa possa ser realizado em papel.

 

Lisboa, 30 de outubro de 2025

A Direção da Associação de Professores de Português

 

[1] De modo a evitar uma dupla penalização, podemos prever uma classificação igual por tipo de item.

 

 

Fonte da imagem aqui.