-
Notifications
You must be signed in to change notification settings - Fork 1
/
3_info_censo.qmd
150 lines (107 loc) · 6.9 KB
/
3_info_censo.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
---
from: markdown+emoji
---
# Conceitos iniciais
O censo demográfico brasileiro é a principal pesquisa populacional domiciliar realizada no Brasil, conduzida pelo Instituto Brasileiro de Geografia e Estatística (IBGE). Trata-se da pesquisa de maior cobertura territorial do país, e que levanta informações sobre as características e condições de vida da população brasileira nos mais diversos temas, como perfil demográfico, educação, trabalho, fecundidade, migração, condições de moradia, etc.
Nesta seção, nós revisamos alguns conceitos básicos sobre a organização dos censos demográficos no Brasil.
::: {.callout-note}
# Nota
Os primeiros censos nacionais foram realizados ainda em 1872 e 1890, seguidos dos censos de 1900 e 1920 [ver @ibge1990estatisticas]. Desde 1940, os censos vem sendo realizados a cada 10 anos, com exceção dos censos de 1991 e 2022.
O conteúo desta oficina se refere basicamente aos censos 'modernos' de 1960 em diante.
:::
## Pesquisa da amostra e do universo
Desde 1960, o Censo Demográfico passou a consistir de duas pesquisas realizadas simultaneamente.
- **Universo**: uma pesquisa aplicada a todos os domicílios (ou universo). Esta pesquisa é feita com um questionário *básico* que costuma ser curto, contendo entre 9 e 30 questões, dependendo da edição do censo.
- **Amostra**: uma pesquisa amostral aplicada a apenas uma parcela dos domicílios. A fração amostral era de 25% nos anos de 1960, 1970 e 1980 e passou para cerca de 10% em 1991 em diante. Esta pesquisa é feita com um questionário mais extenso.
## Microdados da Amostra e Dados Agregados do Universo
Microdados são bancos de dados em que cada observação representa uma unidade de coleta de informação. Nos censos, os microdados se referem aos arquivos em que cada observação ou linha são domicílios ou pessoas. A noção de microdados se contrapõe à de dados agregados, nos quais os casos são “agregações” das informações obtidas a partir por exemplo da soma ou das médias das informações dos microdados. Tais agregações podem ser, por exemplo, no nível de bairros, distritos, municípios etc.
::: {.callout-warning}
# Importante
Os dados disponibilizados pelo IBGE, e que estão disponíveis no pacote {censobr} incluem tnato os microdados da pesquisa amostral quanto os dados do universo agregados por setor censitário.
Obs. O IBGE não disponibiliza os microdados do universo porque a sua divulgação poderia violar o sigilo dos respondentes.
:::
## Setores Censitários e Áreas de Ponderação
Com os Microdados da Amostra é possível fazer análises por indivíduos, famílias e domicílios. Mas análises espaciais, que levam em conta vizinhanças e distâncias geográficas, por exemplo, também podem ser de interesse. Nesse caso, é importante ter ciência da granularidade dos dados – i.e. de qual a menor unidade espacial que permite inferência estatística. Para isso, cabe destacar as duas principais unidades espaciais na construção dos censos demográficos:
### Setores censitários
- Os **setores censitários** são a menor unidade de análise espacial nas pesquisas domiciliares do IBGE. Um setor é uma unidade territorial demarcada para fins operacionais de organizar a coleta de dados. Cada setor é coberto por um único recenseador e possui em média, cerca de 200 domicílios. No entanto, este número, assim como o tamanho do setor podem variar a depender da densidade demográfica de cada região. Os dados do universo são disponibilizados apenas no formato agregado por setores censitários.
### Áreas de ponderação
- As **áreas de ponderação** são a menor unidade espacial para a qual os dados da pesquisa amostral possuem representatividade estatística. Essas áreas são constituídas por agrupamentos de setores censitários contíguos, mas que também variam de acordo com a densidade demográfica de cada região. Para o Censo de 2010, o IBGE estabeleceu que uma área de ponderação deveria ter, no mínimo, 400 domicílios ocupados na amostra. Em regiões menos densamente povoadas, essas áreas acabam ocupando uma larga extensão territorial.
```{R}
#| message: false
#| eval: false
#| code-fold: true
#| label: fig-spatial_layers
#| fig-cap: Camadas espaciais de
library(geobr)
library(ggplot2)
library(dplyr)
library(sf)
# codigo do municipio de Belford Roxo
mymuni <- 3300456
# baixa geometria do municipio
muni <- geobr::read_municipality(mymuni)
# baixa geometria das areas de ponderacao
ap <- geobr::read_weighting_area(code_weighting = mymuni,
year = 2010,
simplified = F)
# baixa geometria dos setores censitarios
ct <- geobr::read_census_tract(code_tract = mymuni,
year = 2010,
simplified = FALSE)
# funcao para 'inclinar' mapa
rotate_data_geom <- function(data, x_add = 0, y_add = 0) {
shear_matrix <- function(){ matrix(c(2, 1.2, 0, 1), 2, 2) }
rotate_matrix <- function(x) {
matrix(c(cos(x), sin(x), -sin(x), cos(x)), 2, 2)
}
dplyr::mutate(data,
geom = geom * shear_matrix() * rotate_matrix(pi/20) + c(x_add, y_add)
)
}
# annotate parameters
x = -116.03
clr = 'gray40'
sz = 4
# MAP
temp1 <- ggplot() +
# municipio
geom_sf(data = rotate_data_geom(data = muni, y_add = .01),
color='gray30', fill='#FCDE70', show.legend = FALSE) +
annotate("text", label='Município', x=x, y=-4.59,
hjust = 0, color=clr, size=sz) +
# areas de ponderacao
geom_sf(data = rotate_data_geom(data = ap, y_add = .07),
fill='#ff7b7b', color='#ff0000', show.legend = FALSE) +
annotate("text", label='Áreas de\nPonderação', x=x, y= -4.53,
hjust = 0, color=clr, size=sz) +
# setores censitarios
geom_sf(data = rotate_data_geom(data = ct, y_add = 0.13),
color='gray30', fill='gray98', show.legend = FALSE) +
annotate("text", label='Setores\nCensitários', x=x, y= -4.47,
hjust = 0, color=clr, size=sz) +
coord_sf(xlim = c(-116.305, -115.98)) +
theme_void() +
theme(plot.background = element_rect(fill = 'white', color='white'))
temp1
# ggsave(temp1, filename = 'fig_spatial_layers.png',
# width = 12, height = 8, units = 'cm', dpi = 300)
```
![](images/fig_spatial_layers.png){width=550 fig-align="center"}
```{R}
#| echo: false
#| eval: false
# todas camandas no mesmo nivel
ggplot() +
# municipio
geom_sf(data = rotate_data_geom(data = muni, y_add = .01),
color='gray30', fill='#FCDE70', show.legend = FALSE) +
# setores censitarios
geom_sf(data = rotate_data_geom(data = ct, y_add = .01),
color='gray30', fill=NA, show.legend = FALSE) +
# areas de ponderacao
geom_sf(data = rotate_data_geom(data = ap, y_add = .01), linewidth =1,
fill=NA, color='#ff0000', show.legend = FALSE) +
coord_sf(xlim = c(-116.305, -115.98)) +
theme_void() +
theme(plot.background = element_rect(fill = 'white', color='white'))
```