-
Notifications
You must be signed in to change notification settings - Fork 0
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Añade configuración en hist1_paro y formato de hist. En CV falta incluir una
- Loading branch information
1 parent
e5d5e67
commit 9b586b6
Showing
26 changed files
with
4,343 additions
and
417 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,17 @@ | ||
{ | ||
"hash": "82939c5a8b18b02c17def8f0272df6ad", | ||
"result": { | ||
"engine": "knitr", | ||
"markdown": "---\ntitle: \"Impacto de las crisis en el paro de Castilla-La Mancha\"\nauthor: \n - Gema Fernández-Avilés (Gema.FAviles@uclm)\n - Isidro Hidalgo (Isidro.Hidalgo@uclm)\nformat: \n html:\n theme: cerulean\n highlight-style: ayu-mirage\n self-contained: true\n # date: \"2024-12-27\"\n embed-resources: true\n toc-title: Summary\n toc: true\n number-sections: true\n preview-links: auto\n code-link: true\n code-fold: true\nnumber-sections: true\nexecute:\n code-overflow: scroll\n# code-fold: true\n echo: true\n eval: true\n output: true\n include: true\n freeze: auto\n fig-height: 5\n warning: false\n comment: \"#>\"\n code-line-numbers: true\n code-copy: true\n---\n\n\n::: {.callout-note}\nLos datos que se utilizan en esta historia están disponibles en el paquete `CDR`\nque puede instalarse con el siguiente comando:\n\n```r\ninstall.packages(\"remotes\")\nremotes::install_github(\"cdr-book/CDR\")\n```\n\nLos datos referentes a la evolución del paro en Castilla-La Mancha se encuentran en el objeto `parados_clm`.\n:::\n\n\n# Entender el contexto: \n\n::: {.callout-tip}\n\n## Cómo definir el propósito y la audiencia de tu análisis\n:::\n\nEn los últimos 15 años el mundo ha sufrido dos grandes periodos de **crisis económica**: en **2008**, de tipo financiero; y en **2020**, a causa de la pandemia de **COVID-19**. La Directora del Instituto de la Mujer de Castilla-La Mancha quiere que mi equipo analice el impacto de ambas crisis en las mujeres de la región.\n\nHemos conseguido del paquete `CDR` un conjunto de datos con, entre otras, algunas variables interesantes: **sexo** y **edad** del parado, **tiempo de búsqueda de empleo** y **sector de procedencia**. El conjunto de datos utilizado comprende la **media anual del paro registrado en la comunidad autónoma de Castilla-La Mancha** desagregado según estas variables, a lo largo de los años que van desde 2007 a 2022.\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Configuración inicial\"}\nlibrary(CDR)\nlibrary(tidyverse)\nlibrary(ggpubr)\nlibrary(ggridges)\n\npaleta_heatmaps <- c(\"#B3FF0080\", \"#213894FF\")\npaleta_lineas <- c(\"blue4\", \"orange\", \"darkgreen\")\n\ndata(\"parados_clm\")\nparados_clm\n```\n\n::: {.cell-output .cell-output-stdout}\n\n```\n# A tibble: 92,215 × 8\n anyo sexo edad sector t_bus_e tramo_edad t_bus_e_agr parados\n <ord> <fct> <dbl> <fct> <ord> <ord> <ord> <dbl>\n 1 2007 hombre 16 agricu t<=7 días <30 años t<=6 meses 0.667\n 2 2018 mujer 36 sinact t<=7 días 30-44 años t<=6 meses 1.67 \n 3 2012 mujer 30 agricu t<=7 días 30-44 años t<=6 meses 5.33 \n 4 2022 mujer 49 constr t<=7 días >44 años t<=6 meses 0.75 \n 5 2007 mujer 54 indust t<=7 días >44 años t<=6 meses 1.5 \n 6 2008 mujer 29 servic t<=7 días <30 años t<=6 meses 58.1 \n 7 2009 hombre 49 sinact t<=7 días >44 años t<=6 meses 1.42 \n 8 2007 hombre 17 agricu t<=7 días <30 años t<=6 meses 1.08 \n 9 2012 hombre 62 servic t<=7 días >44 años t<=6 meses 4.58 \n10 2021 hombre 26 constr t<=7 días <30 años t<=6 meses 5.17 \n# ℹ 92,205 more rows\n```\n\n\n:::\n\n```{.r .cell-code code-summary=\"Configuración inicial\"}\nhelp(parados_clm)\n```\n:::\n\n\n\n\n# Elegir una visualización adecuada\n\n::: {.callout-tip}\n\n## Selección de gráficos y visualizaciones que mejor representen tus datos.\n:::\n\n\n## Impacto de las crisis en la evolución global del paro\n\nPodemos construir un gráfico lineal para empezar viendo la evolución...\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Resumen de los parados por años objetivo\"}\nresumen <- parados_clm |>\n group_by(anyo) |>\n summarise(parados = sum(parados)) |>\n mutate(anyo = as.numeric(as.character(anyo)))\nanyos <- c(2007, 2013, 2019, 2020, 2022)\nparo_anyos <- resumen |>\n filter(anyo %in% anyos) |>\n select(parados) |>\n mutate(parados = round(parados, 0))\npuntos <- data.frame(anyos, paro_anyos)\n```\n:::\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Creación del gráfico lineal\"}\nggplot(resumen, aes(anyo, parados)) +\n geom_line()+\n theme_bw()\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-3-1.png){width=672}\n:::\n:::\n\n\nEl gráfico no tiene una escala de ordenadas realista, y es muy simple. No tiene título. Vamos a mejorarlo un poco...\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Creación del gráfico lineal mejorado\"}\ngraf <- ggplot(resumen, aes(anyo, parados)) +\n geom_line(linewidth = 1, col = paleta_lineas[1], alpha = 0.5) +\n xlab(\"\") +\n ylab(\"número de parados\") +\n geom_point(puntos,\n mapping = aes(x = anyos, y = parados),\n shape = \"circle filled\", size = 2.5, fill = paleta_lineas[1],\n alpha = 0.8\n ) +\n scale_y_continuous(\n labels = function(x) {\n format(x,\n big.mark = \".\",\n decimal.mark = \",\", scientific = FALSE\n )\n },\n limits = c(0, 300000)\n ) +\n ggtitle(\"Impacto de las crisis en el paro de Castilla-La Mancha\") +\n theme_minimal()\n\ngraf\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-4-1.png){width=672}\n:::\n:::\n\n\nEn adelante, vamos a tomar como puntos de referencia los años previos a las crisis: 2007 y 2019, y el último año de datos, 2022. Se puede observar que la crisis de la **COVID-19** aumentó el paro en 2020, pero la **crisis de 2008** tuvo un impacto enorme y generalizado en toda la economía, por lo que su efecto en el paro registrado fue mucho mayor, multiplicándolo casi por 3.\n\n\n\n\n# Eliminar el desorden\n\n::: {.callout-tip}\n\n## Simplificación de gráficos eliminando elementos innecesarios.\n:::\n\n\nBien, pero trabajamos para el Instituto de la mujer... ¡hay que separar por sexo!:\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Resumen por sexo\"}\nresumen_sexo <- parados_clm |>\n group_by(anyo, sexo) |>\n summarise(parados = sum(parados)) |>\n mutate(anyo = as.numeric(as.character(anyo)))\nparo_anyos <- resumen_sexo |>\n filter(anyo %in% anyos) |>\n select(sexo, parados) |>\n mutate(parados = round(parados, 0))\npuntos <- data.frame(\n anyos = rep(anyos, each = 2),\n sexo = paro_anyos$sexo,\n parados = paro_anyos$parados\n)\n```\n:::\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Gráfico de lineas por sexo\"}\ngraf <- ggplot(resumen_sexo, aes(anyo, parados)) +\n geom_line(linewidth = 1, col = paleta_lineas[1], alpha = 0.5) +\n xlab(\"\") +\n ylab(\"número de parados\") +\n facet_wrap(\"sexo\") +\n geom_point(puntos,\n mapping = aes(x = anyos, y = parados),\n shape = \"circle filled\", size = 2.5, fill = paleta_lineas[1],\n alpha = 0.8\n ) +\n scale_y_continuous(\n labels = function(x) {\n format(x,\n big.mark = \".\",\n decimal.mark = \",\", scientific = FALSE\n )\n },\n limits = c(0, 300000)\n ) +\n ggtitle(\"Las mujeres se han recuperado peor de la crisis de 2007\") + \n theme_minimal()\n\ngraf\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-6-1.png){width=672}\n:::\n:::\n\n\n\n¿Lo podemos hacer mejor?: sí, uniendo los gráficos, para mejorar la comparación, añadiendo color y otros formatos...\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Gráfico de lineas por sexo mejorado\"}\ngraf <- ggplot(resumen_sexo, aes(anyo, parados)) +\n geom_line(\n data = resumen_sexo[resumen_sexo$sexo == \"hombre\", ],\n linewidth = 1, col = paleta_lineas[1], alpha = 0.5\n ) +\n geom_line(\n data = resumen_sexo[resumen_sexo$sexo == \"mujer\", ],\n linewidth = 1, col = paleta_lineas[2], alpha = 0.5\n ) +\n xlab(\"\") +\n ylab(\"número de parados\") +\n annotate(\n geom = \"text\", label = \"hombres\", col = paleta_lineas[1],\n x = 2021,\n y = puntos$parados[puntos$sexo == \"hombre\" &\n puntos$anyos == 2022]\n ) +\n annotate(\n geom = \"text\", label = \"mujeres\", col = paleta_lineas[2],\n x = 2021,\n y = puntos$parados[puntos$sexo == \"mujer\" &\n puntos$anyos == 2022]\n ) +\n scale_y_continuous(\n labels = function(x) {\n format(x,\n big.mark = \".\",\n decimal.mark = \",\", scientific = FALSE\n )\n },\n limits = c(0, 150000)\n ) +\n ggtitle(\"Las mujeres se han recuperado peor de la crisis de 2007\") +\n theme_minimal()\n\ngraf\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-7-1.png){width=672}\n:::\n:::\n\n\nEn este caso, como ya habíamos marcado los puntos de giro en el gráfico del paro total, hemos preferido quitarlos, porque no nos gustan estéticamente, pero aprovechamos el último valor para colocar la etiqueta de la serie, mucho mejor que en una leyenda... ¡y más visible!\n\n\n## Evolución del paro medio anual en función de la edad y el sexo\n\nPara ver simultáneamente una variable cuantitativa en función de otras dos variables, podemos usar un mapa de calor:\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Preparación de los datos. Selección de variables y años\"}\ntabla <- parados_clm |>\n select(anyo, sexo, edad, parados) |>\n filter(anyo %in% c(2007, 2019, 2022))\ntabla <- tabla |>\n group_by(anyo, sexo, edad) |>\n summarise(parados = sum(parados))\n```\n:::\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Heatmap por sexo, edad y año\"}\ngraf <- ggplot(tabla, aes(x = sexo, y = edad, fill = parados)) +\n geom_raster() +\n scale_fill_gradientn(colours = paleta_heatmaps) +\n facet_wrap(~anyo) +\n labs(x = \"\", y = \"\") +\n theme_bw()\n \ngraf\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-9-1.png){width=672}\n:::\n:::\n\n\nSe puede apreciar que en los dos procesos críticos se ha producido un **desplazamiento del paro hacia los intervalos de mayor edad**, especialmente en las **mujeres**.\n\nEl mapa de calor es muy útil para una primera impresión, pero ¿es la mejor visualización? Si nos fijamos, no se aprecia bien la forma de la distribución. Vamos a intentar mejorar el resultado:\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Gráfico de paneles por sexo, edad y año\"}\nggplot(tabla, aes(\n x = edad, y = parados,\n col = anyo, fill = anyo\n)) +\n geom_ribbon(aes(ymin = 0, ymax = tabla$parados), alpha = 0.4) +\n facet_wrap(~sexo, ncol = 2) +\n ylab(\"número de parados\") +\n scale_y_continuous(labels = function(x) {\n format(x,\n big.mark = \".\", decimal.mark = \",\", scientific = FALSE\n )\n }) +\n theme_bw() \n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-10-1.png){width=672}\n:::\n:::\n\n\nAhora se ve mucho mejor que en 2007, antes de ambas crisis, los parados presentan **dos máximos**, en torno a 25 y 60 años, mientras que las desempleadas tienen una distribución bastante centrada entre 30 y 40 años. En cambio, en 2019 y aún más en 2022 se aprecia el desplazamiento de la distribución de los parados de ambos sexos hacia los estratos de edad **mayores de 50 años**. Este desplazamiento es algo más intenso en las mujeres.\n\n\n\n# Enfocar la atención donde importa: estamos trabajando para el Instituto de la mujer\n\n\n::: {.callout-tip}\n\n## Técnicas para destacar los puntos clave en tus visualizaciones.\n:::\n\n\n\n\n## Evolución del paro femenino según el tiempo de búsqueda de empleo\n\nHacemos lo mismo que con el sexo, pero incluimos la variable `t_bus_e_agr` (tiempo de búsqueda de empleo):\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Preparación de los datos. Selección de variables y años\"}\ntabla <- parados_clm |>\n filter(anyo %in% c(2007, 2019, 2022)) |>\n select(anyo, sexo, t_bus_e_agr, edad, parados)\ntabla <- tabla |>\n group_by(anyo, t_bus_e_agr, edad, sexo) |>\n summarise(parados = sum(parados))\n```\n:::\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Gráfico de facetas por sexo, sector económico, edad y año\"}\nggplot(tabla, aes(\n x = edad, y = parados,\n col = anyo, fill = anyo\n)) +\n geom_ribbon(aes(ymin = 0, ymax = tabla$parados), alpha = 0.4) +\n facet_wrap(~ sexo * t_bus_e_agr, ncol = 4) +\n ylab(\"número de parados\") +\n labs(fill = \"años:\", color = \"años:\") +\n scale_y_continuous(labels = function(x) {\n format(x,\n big.mark = \".\", decimal.mark = \",\", scientific = FALSE\n )\n }) +\n ggtitle(\"Se dispara el paro de larga duración\") +\n theme_bw()\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-12-1.png){width=672}\n:::\n:::\n\n\nSe aprecia claramente que el tramo con mayor incremento de número de parados es el correspondiente a más de 24 meses de búsqueda de empleo (**paro de muy larga duración**), ya que la crisis financiera de 2008 les redujo su probabilidad de encontrar empleo. Se puede afirmar también que los dos períodos de crisis han provocado la creación de un **paro estructural de larga duración, y de más edad**. Este efecto es mayor en las mujeres.\n\n## Evolución del paro femenino según el sector de procedencia\n\nSi repetimos el gráfico según el sector de procedencia, tenemos:\n\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Preparación de datos. Selección de variables y años\"}\ntabla <- parados_clm |>\n filter(anyo %in% c(2007, 2019, 2022)) |>\n select(anyo, sexo, sector, edad, parados)\ntabla <- tabla |>\n group_by(anyo, sector, edad, sexo) |>\n summarise(parados = sum(parados))\n```\n:::\n\n::: {.cell}\n\n```{.r .cell-code code-summary=\"Gráfico de facetas por sexo, sector, edad y año\"}\nggplot(tabla, aes(\n x = edad, y = parados,\n col = anyo, fill = anyo\n)) +\n geom_ribbon(aes(ymin = 0, ymax = tabla$parados), alpha = 0.4) +\n facet_wrap(~ sexo * sector, ncol = 5) +\n ylab(\"número de parados\") +\n labs(fill = \"años:\", color = \"años:\") +\n scale_y_continuous(labels = function(x) {\n format(x,\n big.mark = \".\", decimal.mark = \",\", scientific = FALSE\n )\n }) +\n ggtitle(\"El sector servicios acapara el mayor aumento de paro\") +\n theme_bw()\n```\n\n::: {.cell-output-display}\n![](hist1_paro_files/figure-html/unnamed-chunk-14-1.png){width=672}\n:::\n:::\n\n\n\n\n# Contar una historia\n\n::: {.callout-tip}\n\n## Cómo narrar una historia convincente con tus datos.\n:::\n\n## Inicio\n\nssssssssssssssss\n\n## Trama \n\nssssssssssssssss\n\n## Desenlace\n\nLa crisis de 2008 tuvo un gran impacto en el paro registrado de Castilla-La Mancha, multiplicándolo por un factor mayor de 3 desde 2007. Sin embargo, a partir del año 2013 el paro registrado inicia una tendencia a la baja muy pronunciada que aún hoy continúa, después de haber sufrido un rebote debido a la crisis de la COVID-19.\n\nLa **población mayor de 45 años**, el **sector servicios** y los **parados de larga duración** son los grandes perjudicados por ambos procesos de crisis, siendo este **impacto mucho mayor en las mujeres**.\n", | ||
"supporting": [ | ||
"hist1_paro_files" | ||
], | ||
"filters": [ | ||
"rmarkdown/pagebreak.lua" | ||
], | ||
"includes": {}, | ||
"engineDependencies": {}, | ||
"preserve": {}, | ||
"postProcess": true | ||
} | ||
} |
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Oops, something went wrong.