Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos...

13
Distribuição espacial do desempenho dos alunos de escolas públicas no ENEM: município de São Paulo (2011 2017) EDUARDO FELIX JUSTINIANO 1 ALFREDO PEREIRA DE QUEIROZ 2 RESUMO Este estudo avalia a eficiência de cinco zoneamentos do município de São Paulo para a representação espacial do desempenho dos alunos no ENEM. Dados de 294 mil alunos do ensino médio, agrupados em 680 escolas, extraídos dos censos escolares e do ENEM de 2011 a 2017, foram reunidos em áreas modificáveis. A renda familiar e a participação dos estudantes do ENEM foram as variáveis que melhor se correlacionaram com a pontuação média. Dentre os zoneamentos avaliados, o das prefeituras regionais mostrou representação cartográfica mais eficiente. Palavras-chave: ENEM, MAUP, Escola pública, Zoneamento ABSTRACT This study evaluates the efficiency of five zoning in the city of São Paulo for the spatial representation of students' performance in ENEM. Data of 294 thousand high school students, grouped in 680 schools, extracted from the school censuses and ENEM from 2011 to 2017, were gathered in modifiable areas. The family income and participation of students on ENEM were the variables that best correlated with the mean score. Among the evaluated zonings, the one of regional prefectures showed more efficient cartographic representation. Keywords: ENEM, MAUP, Public school, Zoning 1 - Introdução O Exame Nacional do Ensino Médio (ENEM) é um dos maiores testes educacionais do mundo, em relação ao número de candidatos. Em 2014, eram mais de 8,7 milhões de inscritos, porém 2,5 milhões se abstiveram da prova. 1 Acadêmico do Programa de Pós-Graduação em Geografia Física da Universidade de São Paulo. E- mail de contato: [email protected]. 2 Docente do Programa de Pós-Graduação em Geografia Física da Universidade de São Paulo. E-mail de contato: [email protected].

Transcript of Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos...

Page 1: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

Distribuição espacial do desempenho dos alunos de escolas

públicas no ENEM: município de São Paulo (2011 – 2017)

EDUARDO FELIX JUSTINIANO1

ALFREDO PEREIRA DE QUEIROZ2

RESUMO

Este estudo avalia a eficiência de cinco zoneamentos do município de São Paulo para a

representação espacial do desempenho dos alunos no ENEM. Dados de 294 mil alunos do ensino

médio, agrupados em 680 escolas, extraídos dos censos escolares e do ENEM de 2011 a 2017, foram

reunidos em áreas modificáveis. A renda familiar e a participação dos estudantes do ENEM foram as

variáveis que melhor se correlacionaram com a pontuação média. Dentre os zoneamentos avaliados,

o das prefeituras regionais mostrou representação cartográfica mais eficiente.

Palavras-chave: ENEM, MAUP, Escola pública, Zoneamento

ABSTRACT

This study evaluates the efficiency of five zoning in the city of São Paulo for the spatial

representation of students' performance in ENEM. Data of 294 thousand high school students, grouped

in 680 schools, extracted from the school censuses and ENEM from 2011 to 2017, were gathered in

modifiable areas. The family income and participation of students on ENEM were the variables that best

correlated with the mean score. Among the evaluated zonings, the one of regional prefectures showed

more efficient cartographic representation.

Keywords: ENEM, MAUP, Public school, Zoning

1 - Introdução

O Exame Nacional do Ensino Médio (ENEM) é um dos maiores testes

educacionais do mundo, em relação ao número de candidatos. Em 2014, eram mais

de 8,7 milhões de inscritos, porém 2,5 milhões se abstiveram da prova.

1 Acadêmico do Programa de Pós-Graduação em Geografia Física da Universidade de São Paulo. E-mail de contato: [email protected].

2 Docente do Programa de Pós-Graduação em Geografia Física da Universidade de São Paulo. E-mail de contato: [email protected].

Page 2: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

Diversos autores evidenciam uma relação entre o rendimento escolar,

expressos pelos resultados dos testes educacionais, e as características

socioeconômicas dos alunos. Thieme et al. (2016) aborda variáveis contextuais e

socioeconômicas que estão além do controle da escola. Tekwe et al. (2004) questiona

se as escolas podem ser responsabilizadas pelos efeitos significativos de fatores

sociodemográficos nos resultados obtidos pelos seus alunos em testes educacionais.

Meyer (1997) considera que os resultados dos testes educacionais como indicador

escolar é falho porque o desempenho dos alunos pode estar contaminado pela

mobilidade destes entre escolas e por fatores extraescolares. Para Wodtke et al.

(2011) a exposição contínua dos alunos a bairros desfavorecidos, caracterizados pela

alta pobreza, desemprego e recebimento de benefício social, famílias numerosas,

chefiadas por mulheres e poucos adultos graduados (ensino médio e superior),

durante todo o curso de vida da infância tem um impacto devastador sobre as chances

de formação no ensino médio.

No Brasil, poucos estudos procuram espacializar a relação entre o rendimento

escolar e as características socioeconômicas. Merecem destaque, no entanto, as

pesquisas desenvolvidas por Torres et al. (2003), na Região Metropolitana de São

Paulo e o de Cunha et al. (2009), que abordaram a relação entre os resultados obtidos

pelo SARESP e as condições socioeconômicas, de moradia e as estruturas das

escolas de Campinas.

Um dos aspectos que dificulta a representação espacial deste tipo de pesquisa

é que a proximidade entre a escola e o local de moradia dos alunos não é condição

específica para sua matrícula. Em decorrência, há restrições para representar

espacialmente o desempenho dos alunos por escola, usando metodologias como a

área de influência dos polígonos de Thiessen, a relação de vizinhança, a estimativa

de densidade de Kernel e o decaimento por distância.

Uma das alternativas é o agrupamento de alunos por escolas, distribuídas em

zonas contíguas, que possibilitaria a representação da pontuação média dos alunos

no ENEM e a correlação com suas características socioeconômicas. Contudo, dadas

Page 3: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

às características de representação, sempre haverá questionamento sobre a eficácia

dos zoneamentos.

A correlação de variáveis em zonas que podem ser modificáveis é uma antiga

discussão da Geografia. Henry Sheldon, em 1931, observou a modificação de valor

da correlação entre variáveis na medida em que a dimensão e o número de áreas

analisadas eram alterados. Esta questão se tornaria conhecida, décadas depois,

como o problema das unidades de área modificáveis (modifiable área unit problem -

MAUP).

Este trabalho tem como objetivo analisar a eficiência dos zoneamentos para a

representação do desempenho médio no ENEM dos alunos de escolas públicas

correlacionado com a renda familiar. Utilizou a metodologia proposta por Openshaw

(1984) para auxiliar na avaliação de zoneamentos gerados por procedimentos

automáticos.

2 - Embasamento teórico

De acordo com Openshaw (1984), o MAUP é composto por dois problemas

distintos, mas muito relacionados: escala e agregação. Indica que os resultados

decorrentes do seu agrupamento variam quando: 1) a escala de análise é alterada

pela agregação de zonas (ex.: de setor censitário para área de ponderação) e 2) o

número de zonas é mantido, porém os limites destas se alteram e, consequentemente,

os dados são agregados de maneira diversa.

Outros pioneiros sobre o assunto foram Gehlke e Biehl (1934). Demonstraram

que a variação nos valores do coeficiente de correlação pode estar condicionada ao

tamanho das unidades de área utilizadas e que, quanto maior a área e o agrupamento,

maior seria a correlação entre as variáveis.

Robinson (1950) estabeleceu uma diferenciação entre correlação ecológica e

correlação individual. Na correlação individual, o objeto estatístico é indivisível e as

variáveis são propriedades descritivas de indivíduos. Seu valor é o da correlação de

Pearson entre duas variáveis de todos os indivíduos, desconsiderando-se o

posicionamento geográfico. Na correlação ecológica, o objeto estatístico é um grupo

Page 4: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

de pessoas e as variáveis podem ser expressas em percentagens, medianas e,

principalmente, médias. O valor da correlação ecológica não é normalmente calculado

com ponderação e certamente não é igual ao valor da correlação individual

correspondente.

Para Alker (1969), a atribuição de valores das correlações (ou covariâncias)

ecológicas aos indivíduos é conhecida como falácia ecológica. Na direção inversa, a

atribuição de valores das correlações individuais para o zoneamento é conhecida

como falácia individualista. Além destas, as falácias podem ocorrer quando na

atribuição de valores de covariância ou de correlação de um indivíduo para uma zona

(falácia universal), da zona para o indivíduo (falácia seletiva) e de uma zona para o

zoneamento ou grupo de zonas e vice-versa (falácia de escala). As falácias também

podem ocorrer quando o contexto ou a estrutura social altera a força ou a forma das

relações causais ou estatísticas (falácia contextual).

Os zoneamentos atuam como um detector de padrões espaciais e a análise

dos padrões depende dos limites do zoneamento. As zonas se constituem em objetos

ou áreas geográficas individualizadas que são a unidade básica para a observação e

medição de fenômenos espaciais (OPENSHAW, 1984). A agregação de área pode

diminuir os valores da variância da população, distorcendo ou eliminando a

heterogeneidade espacial (JELINSKI; WU, 1996).

2.1. Metodologia

Openshaw (1984) afirma que os resultados do estudo de dados zonais

dependem dos zoneamentos adotados, que são essencialmente arbitrários e

modificáveis. Recomenda que, ao invés de aceitar qualquer resultado que um

zoneamento produz, deve-se especificar previamente qual é o resultado esperado

(hipótese). Se o resultado desejado violar as suposições estatísticas ou fatores

geográficos, a hipótese deve ser rejeitada.

O referido autor sugere uma metodologia, baseadas em cinco etapas, para

avaliar os zoneamentos e unidades de área, essencialmente arbitrárias e

modificáveis. Esta metodologia pode ser utilizada para indicar os zoneamentos que

Page 5: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

melhor representem a distribuição das pontuações médias dos alunos no ENEM.

Neste estudo, optou-se por simplificar as etapas propostas, como mostra a Tabela 1.

Cada zona deverá conter um número mínimo de alunos, por faixa de renda e

por ano, de forma a não gerar um coeficiente de variação de valor elevado das

pontuações médias anuais ao longo do período observado.

Etapa Procedimentos

1 Definir o propósito de pesquisa de forma explícita, especulando-se quanto ao

resultado esperado, tomando-se como base o conhecimento prévio ou o

resultado desejado. Esse resultado desejado seria expresso como uma

hipótese e estabelecido como uma função objetivo.

2 Tentar obter o resultado desejado identificando os zoneamentos que

otimizam a função objetivo.

3 Interpretar os resultados no sentido estatístico e verificar se os resultados

esperados foram alcançados com grau de erro tolerável. Se não, rejeitar ou

alterar a hipótese e retomar a etapa 1.

4 Verificar a necessidade de introduzir restrições sobre as zonas para garantir

que estas sejam conectadas internamente.

5 Se em um resultado satisfatório for necessário a introdução de restrições,

retornar à etapa 3 para reinterpretação ou verificar as consequências de não

satisfazer algumas ou todas as restrições.

Tabela 1 – Procedimentos para testar zoneamentos. Fonte: Openshaw (1984).

2.1.1. Procedimentos

A Figura 1 ilustra os procedimentos para testar os diferentes zoneamentos,

descritos na Tabela 1. Optou-se por categorizar a média dos alunos em três faixas de

Page 6: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

notas (Tabela 2) para verificar a variação zonal centro periferia das pontuações

médias com e sem segmentação por faixa de renda.

Figura 1 – Organograma dos procedimentos para testar os zoneamentos. Organizada pelos autores.

Faixa Notas Alunos

Abaixo de meio desvio-padrão da média Abaixo de 2.376,0 95.726

Da média menos meio desvio-padrão até média

mais meio desvio-padrão De 2.376,0 a 2.691,6 114.017

Acima da média mais meio desvio-padrão Acima de .2691,6 84.186

Tabela 2 – Faixas de pontuação consideradas para testar os zoneamentos.

Os zoneamentos testados foram: Prefeituras Regionais, com 32 zonas e a

agregação destas em 8 macrorregiões administrativas; as Diretorias de Ensino da

Capital, com 13 zonas, agregação em 4 regiões e um zoneamento proposto com 58

Page 7: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

zonas. Em cada zona foi atribuído um grupo de escolas, possibilitando estabelecer os

resultados médios das pontuações no ENEM dos alunos e de suas características

socioeconômicas.

Após a definição do zoneamento mais adequado, as pontuações médias dos

alunos foram reclassificadas para uma melhor representação da pontuação média no

ENEM no município de São Paulo e das variáveis correlacionadas.

2.1.2. Análise exploratória dos dados

Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram

utilizados. Os alunos de escolas públicas do município de São Paulo, de até 18 anos

e matriculados no último ano letivo do ensino médio foram selecionados. Dos 375 mil

alunos concluintes de escolas públicas, cerca de 294 mil alunos de 680 escolas se

inscreveram e pontuaram em todas as provas e na redação.

As provas objetivas do ENEM são divididas em 4 áreas do conhecimento e

redação. A somatória da pontuação obtida pelos alunos de todas as provas e da

redação se mostrou como a variável de desempenho mais apropriada para comparar

os resultados dos exames de um ano para o outro.

Foram avaliadas as variáveis cor/raça, renda familiar, grau de instrução dos

pais e número de moradores na residência. A renda familiar apresentou maior

correlação individual com a pontuação no ENEM.

Para o teste dos zoneamentos, optou-se por reclassificar a renda familiar em 4

faixas: até um salário mínimo; mais de um até 2 s.m.; mais de 2 até 5 s.m. e acima de

5 s.m.. Todos os zoneamentos avaliados apresentaram correlação ecológica

altamente positiva entre a renda familiar média e a pontuação média no ENEM de

2011 a 2017, variando de 0,957052 a 0,989779. A correlação ecológica entre a

pontuação média e a participação de alunos encontrada também foi altamente

positiva, variando de 0,916882 a 0,988401.

3 - Resultados

Os zoneamentos testados foram: Regiões de Diretorias de Ensino da Capital (

Page 8: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

Figura 2A); Diretorias de Ensino da Capital (

Figura 2B); Macrorregiões Administrativas (

Figura 2C); Prefeituras Regionais (

Figura 2D) e Zoneamento Proposto (

Figura 2E).

Os melhores resultados foram obtidos somente nos zoneamentos Prefeituras

Regionais e o zoneamento proposto (Figuras 2 D e 2E). Eles mostraram a variação

zonal das notas e evidenciaram a relação centro periferia em diferentes faixas de

renda.

Page 9: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

Figura 2 – Distribuição da pontuação média em zoneamentos do Município de São Paulo.

O coeficiente de variação das pontuações médias anuais por zona e por faixa

de renda foi elevado, principalmente, onde ocorreu um número inferior a 10 alunos.

Assim, o zoneamento proposto foi desconsiderado pela ocorrência de zonas com

poucos alunos em um ou mais anos, resultando numa alta variabilidade anual da

pontuação média no período.

Como o zoneamento Prefeitura Regional (2D) apresentou conexão interna em

todas as zonas e satisfez o esperado para a etapa 4, tornou-se desnecessário realizar

a etapa 5.

A correlação ecológica entre a média das pontuações dos alunos por zona e o

percentual de participação dos alunos no ENEM para o zoneamento Prefeituras

Regionais foi altamente positiva: 0,934194. Em relação à participação de alunos por

faixa de renda, o valor da correlação ecológica entre a pontuação e o percentual de

alunos de renda familiar de até 2 S.M. foi 0,531673 e é inferior ao valor da correlação

ecológica com o percentual de alunos de renda familiar acima de 2 S.M., 0,908989.

Estes valores permitiram a confecção de um mapa (Erro! Fonte de referência

não encontrada.) que representa a pontuação média dos alunos por Prefeitura

Regional e que também reflete a participação dos alunos no ENEM e a proporção dos

alunos por renda familiar. As faixas de notas foram classificadas por quintis e a renda

familiar e a participação dos alunos no ENEM foram representadas por meio de

gráficos.

Page 10: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município
Page 11: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

Figura 3 – Pontuação média dos estudantes de escolas públicas no ENEM no Município de São

Paulo (2011-2017). Organizada pelos autores.

4 - Conclusões

A AED revelou que a renda familiar é a variável socioeconômica que apresenta

maior correlação individual com a pontuação no ENEM dos alunos de escolas

públicas. A correlação ecológica entre a pontuação média no zoneamento Prefeituras

Regionais e o percentual de alunos de renda familiar de acima de 2 S.M. é maior do

Page 12: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

que a correlação com o percentual de alunos de renda familiar inferior. Isto indicaria

que a pontuação média tem uma relação mais próxima com a participação de alunos

de maior renda familiar.

Apesar de todos os zoneamentos testados representarem a pontuação média

no ENEM e diferenciarem o centro da periferia, os procedimentos propostos por

Openshaw (1984) possibilitaram reconhecer a maior eficiência do zoneamento

Prefeituras Regionais do Município de São Paulo.

A representação das distribuições espaciais da pontuação média no ENEM foi

coerente com a das variáveis de altas correlações com a pontuação média. A

pontuação média é maior nas zonas nas quais o número de abstenções no teste

educacional é inferior ao número de participantes no ENEM com renda superior a 2

S.M. Por outro lado, a pontuação média é menor nas zonas onde o número de alunos

de renda superior a 2 S.M. é inferior ao número de abstenções e de alunos de renda

inferior (Erro! Fonte de referência não encontrada.).

A representação cartográfica das pontuações médias do ENEM no zoneamento

aprovado permitiu verificar uma curva negativa da renda familiar como indicador social

à medida que se vai do centro à periferia como apontado por Torres et al. (2003),

porém, não foi possível observar a heterogeneidade das áreas periféricas.

Os zoneamentos reprovados, com menores números de zonas e de maior

agregação, apresentaram baixa ou nenhuma diferenciação zonal da pontuação obtida

no teste educacional. Este resultado é compatível com o exemplificado por Jelinski e

Wu (1996) que relacionaram a diminuição da heterogeneidade espacial da agregação

com a diminuição da variância.

O zoneamento Região de Diretorias de Ensino contém áreas que são agregadas do zoneamento

Diretorias de Ensino da Capital, da mesma forma que a Macrorregião Administrativa contém áreas

que foram agregadas das Prefeituras Regionais (Figura 2

Figura 2). Nesta agregação, a diminuição da heterogeneidade espacial

exemplifica a falácia de escala, descrita por Alker (1969).

Page 13: Distribuição espacial do desempenho dos alunos de ...€¦ · Os microdados do ENEM e dos censos escolares de 2011 a 2017 foram utilizados. Os alunos de escolas públicas do município

5 - BIBLIOGRAFIA

ALKER, H. R. A Typology of Ecological Fallacies. In: DOGAN, M.; ROKKAN, S. (Eds.).

Quantitative Ecological Analysis in the Social Sciences. Cambridge: MIT Press, 1969.

CUNHA, J. M. P. D. et al. Social segregation and academic achievement in state-run

elementary schools in the municipality of Campinas, Brazil. Geoforum, v. 40, n. 5, p.

873–883, 2009.

GEHLKE, C. E.; BIEHL, K. Certain Effects of Grouping Upon the Size of the Correlation

Coefficient in Census Tract Material. Journal of the American Statistical Association,

v. 29, n. 185, p. 169, 1934.

JELINSKI, D. E.; WU, J. The modifiable areal unit problem and implications for

landscape ecology. Landscape Ecology, v. 11, n. 3, p. 129–140, jun. 1996.

MEYER, R. H. Value-added indicators of school performance: A primer. Economics of

Education Review, v. 16, n. 3, p. 283–301, 1997.

OPENSHAW, S. The Modifiable Areal Unit Problem. Concepts and Techniques in

Modern Geography, v. 38, p. 169–174, 1984.

ROBINSON, W. S. Ecological Correlations and the Behavior of Individuals. American

Sociological Review, v. 15, n. 3, p. 351, jun. 1950.

TEKWE, C. D. et al. An Empirical Comparison of Statistical Models for Value-Added

Assessment of School Performance. Journal of Educational and Behavioral Statistics,

v. 29, n. 1, p. 11–36, 23 mar. 2004.

THIEME, C. et al. Value added, educational accountability approaches and their

effects on schools’ rankings: Evidence from Chile. European Journal of Operational

Research, v. 253, n. 2, p. 456–471, 2016.

TORRES, H. DA G. et al. Pobreza e espaço: padrões de segregação em São Paulo.

Estudos Avançados, v. 17, n. 47, p. 97–128, abr. 2003.

WODTKE, G. T.; HARDING, D. J.; ELWERT, F. Neighborhood effects in temporal

perspective: The impact of long-term exposure to concentrated disadvantage on high

school graduation. American Sociological Review, v. 76, n. 5, p. 713–736, 2011.